IPFS技术系列 | 揭秘IPFS数据交换模块Bitswap

导?读

本文为IPFS系列文第4篇,详解IPFS的核心模块——Bitswap。

星际文件系统是一个旨在创建持久且分布式存储和共享文件的网络传输协议。

与传统的文件系统不同,它是一种基于内容寻址的点对点超媒体分发协议。

IPFS网络中的节点构成一个分布式文件系统网络,其中Bitswap是IPFS的核心模块,负责与网络中其他节点之间请求和发送数据块。

图1

IPFS将文件分解为称为block的数据块,这些块由内容标识符标识。?

IPFS文件内容存储在不同的节点上,每个节点存储rootblock,少量节点存储完整文件数据,大部分节点存储部分文件block。因为block分散存储在不同节点,Bitswap协议解决了从多个节点高效获取全部数据块的问题。

基于IPFS搭建的去中心化前端Dappnet已推出Alpha版本:5月9日消息,基于IPFS搭建的去中心化前端Dappnet已推出Alpha版本,支持Chrome、Firefox和Brave浏览器,同时完全开源,用户可在macOS上通过它访问Curve、ENS、1inch和其它部署到.eth域名的网站,且永远不会被审查或关闭。[2023/5/9 14:51:24]

图2?多节点文件存储示意图

总体架构

本文基于Bitswapv0.3.3版本进行分析。

IPFS向Bitswap获取block,Bitswap是IPFSexchange接口的具体实现,负责完成IPFS网络数据交换功能。

图3?Bitswap组件架构图

Bitswap协议内容比较繁琐,为了降低实现复杂度协议划分为block请求模块、block发送模块、会话管理模块、block提供者发现模块、网络模块等。

Bitswap模块负责接收新的消息并且提供对外数据交换接口。

session管理模块用来管理多个session,每个session管理一组文件的下载,来提高下载效率。

金色算力云副总裁Maggle Lin:IPFS仍处于早起发展阶段,矿机厂商仍有机会弯道超车:由开源矿池和火币主办,金色算力云、链上ChainUP、Filecoin Beijing联合主办的“分布式存储中国行暨开源矿池IPFS私享会”2020年12月6日在武汉举行。金色算力云副总裁Maggle Lin会上表示,从2014年实验室提出IPFS,2017年开始公布,到2020年10月份主网上线,Filecoin仍处于早期发展阶段。在主网上线的时候选择了停机的矿机厂商不在少数,一部分是因为质押币的问题,另一部分则是因为底层技术的问题。从另一个层面而言,这也正是优胜劣汰的时候,有一些前期没有卖那么多矿机的矿机厂商,也可以在这时候进行弯道超车。从金色算力云业务层面而言,一直对于矿工有各种保障,一是2021年1月1号主网如果没有上线,可以全额退款,二是填充时间有保障,三是云算力第一年没有挖回本,第二年继续可以挖。对于矿工而言,市场上是有很多选择的,让矿工可以真正享受到早期挖矿红利。[2020/12/7 14:27:15]

block发送模块负责管理向其它节点发送数据块。block请求模块负责管理数据块的请求。block提供者发现模块负责通过DHT网络发现网络中的数据块,通常session找不到已拥有所需block的节点时会调用此模块进行数据块发现。

协议概述

为了完成节点间block交换,Bitswap定义了通信消息及通信协议。

翁梓耀:从矿工、社区、宏观战略层面分析Filecoin/IPFS价值:IPFS100.com现场报道,2020年8月11日14:00,由DAP总冠名、大德资本、金色财经、PBank主办的2020第一届新经济资产数字化高峰论坛在深圳福田香格里拉大酒店拉开帷幕。在以《炒作还是实力——IPFS价值几何》为题的圆桌中,逆熵科技联合创始人&COO翁梓耀指出:Filecoin/IPFS生态是被市场所需要的。从矿工的角度来看,矿工们需要想象空间去继续矿业这个生态领域,因此矿工们需要Filecoin;从社区的角度来看,社区需要热度;从宏观战略层面来看,在每年750亿美元以上增速的分布式存储赛道上,数据将因为Filecoin而更加安全。综上,Filecoin是值得被关注的。[2020/8/11]

图4

Bitswap消息处理流程:

1、IPFS请求文件区块,Bitswap发送want-have消息携带CID1信息到连接的所有节点。节点根据自己是否有CID1文件块返回have或dont-have消息。

2、client向拥有CID1的节点发送want-block消息,节点返回相应的block消息。

ChainUP联合节点资本发起设立2000万美元IPFS专项基金:2020年6月22日,由金色财经主办,节点咨询、IPFS100.com承办,星际特工、麦客存储联合主办的“星际漫游指南——IPFS技术与应用研讨论坛”在深圳拉开帷幕。

在本次大会上,ChainUP联合节点资本共同宣布发起设立2000万美元IPFS专项基金,主要投资对象包括媒体平台、算力云、矿机等;ChainUP创始人兼CEO钟庚发、HashFin CEO Maggie作为主要嘉宾代表,出席了本次IPFS专项基金成立仪式。

ChainUP表示希望能够借此机会,深度布局IPFS领域,助力Filecoin未来的应用场景早日落地。[2020/6/22]

3、当没有节点有请求的block,Bitswap广播want-have到所有的连接节点,或者通过DHT查找拥有文件区块的节点。

模块详解

▲?Bitswap模块

Bitswap模块负责接收新消息并且实现对外的数据交换接口。

当接收到新消息后,Bitswap处理流程:

1、记录有关消息的一些统计信息

2、通知发送模块wants消息,这样数据发送模块可以根据实际情况向需求节点发送响应消息。

3、通知发送模块任何收到的blocks,发送模块根据节点的需求列表可以将接收到的块发送给任何需要它们的节点

MyEtherWallet发布网站托管功能,可自动将网站上传至IPFS:金色财经报道,以太坊钱包MyEtherWallet正在发布一项名为“托管你自己的网站(Host Your Own Site)”的功能,该功能为用户提供了一个简单的界面,可将网站上传到星际文件系统(IPFS)。这些网站托管在去中心化的P2P计算机网络中,这使它们能够抵御大多数传统网络上可用的审查工具。该集成可自动执行将网站上传到IPFS的过程。[2020/6/19]

4、向SessionManager通知接收到的blocks,HAVEs和DONT_HAVEs消息,这样SessionManager可以通知消息相关的session。

Bitswap通过FacadePattern提高了模块使用的便利性,使得Bitswap子系统的用法变得简单,避免了IPFS和Bitswap的高度耦合。

▲?Session管理模块

session管理模块用来管理多个数据块下载session,每个session管理一组文件的下载。

当SessionManager收到新消息时,它将

1、通知BlockPresenceManager组件跟踪每个block。

2、通知对接收到的block感兴趣并想要的Sessions。

3、通知PeerManager组件收到的block,PeerManager检查是否有任何wants被发送到节点以接收已经收到的块。?如果是这样,它将向那些节点发送“CANCEL”消息,防止其它节点重复发送消息。

Session管理模块通过协调多个session的数据需求来提高数据交互的效率,避免数据块的重复请求、发送。

▲?Session模块

Session管理一组文件的下载,用来提高一组文件块,比如单个文件下载效率。当IPFS调用Bitswap时,Bitswap会创建一个新的Session并调用Session的相应方法,比如GetBlocks()获取blocks。Session会管理一个节点列表,数据获取过程只会向session中的节点获取数据,而不是所有的连接节点。当Session中的节点都没有某个block时,Bitswap才会通过DHT获取具有block的节点并加入session。

由于session刚开始没有任何节点,处于“discovery”模式。当IPFS最初从session请求block时,该session处理流程如下:

1、通知SessionInterestManager组件它感兴趣的block。

2、通知sessionWantManager组件需要的block。

3、通知PeerManager组件向连接节点发送“want-have”消息,以发现哪些节点有需要的block。

4、查询ProviderQueryManager组件以发现哪些节点具有该block。

当session收到带有“HAVE”或“block”的消息时,它将通知SessionPeerManager组件。

当session收到带有“block”的消息时,它将通知SessionInterestManager组件。

一旦session具有节点,就不再处于“discovery”模式。当IPFS请求后续block时,session将通知sessionWantSender组件。sessionWantSender组件通知PeerManager组件向会话中的节点发送“want-have”和“want-block”消息。

对于session所需的每个block,sessionWantSender组件通过与BlockPresenceManager组件核对哪些节点已为该block发送了“HAVE”,来确定哪个节点最有可能拥有该block。如果多个节点发送过“HAVE”,则会根据先前请求回复速度来选择节点。

由于DHT内容发现速度慢并且网络带宽消耗大,session通过向一组含有目标数据块可能性大的节点获取数据,从而大大提高了数据块获取的效率。

▲?Block发送模块

block发送模块负责管理向其它节点发送数据块,包含节点需求管理组件和消息发送任务队列。

Engine是block发送模块的处理类,当Engine被告知有新的wants时

1、将want添加到Ledger,Ledger会存储每个节点的需求列表。

2、检查blockstore中的相应block,并将任务添加到PeerTaskQueue组件。如果block库没有想要的block,则添加“DONT_HAVE”任务;如果blockstore有block,对于“want-have”添加了“HAVE”任务,对于“want-block”添加了“block”任务。

3、当Engine收到新block的消息时,它会检查Ledger以查看是否有节点需要此block。对于发送“want-have”的每个节点向PeerTaskQueue组件添加一个?“HAVE”任务,对于为发送了“want-block”的每个节点,向PeerTaskQueue组件添加一个“block”任务。

4、Engine会定期从PeerTaskQueue组件中取出任务,并创建带有“blocks”,“HAVEs”和“DONT_HAVEs”的消息。

PeerTaskQueue组件通过对任务进行优先级排序,发送队列中数据量最少的节点方具有最高优先级,通过这种流控措施,提高数据块发送处理效率。

▲?数据块请求模块

Block请求模块负责管理数据块的请求。PeerManager组件为连接到Bitswap的每个节点创建一个MessageQueue组件,记录了“want-have”?、“want-block”已发送到哪个节点,并将任何新的wants定向到正确的节点。并且MessageQueue组件通过合并多个want为一条消息,然后将该消息发送给节点,从而提高了消息发送效率。

▲?内容发现模块

当Bitswap找不到已拥有所需block的节点时,它会使用DHT进行内容发现。Bitswap通过ProviderQueryManager组件管理这些请求,ProviderQueryManager组件对请求进行速率限制,并对进行中的请求进行重复删除处理。

总结

Bitswap作为IPFS网络数据交换接口的具体实现,设计并实现了一套高效的节点间交换数据的协议。

协议主要关注点是如何快速、高效获取需要的block,其中包括节点选择策略,如何最大化利用每个节点的能力。

Bitswap通过FacadePattern提高了模块使用的便利性,在具体实现上解耦复杂依赖到各功能模块,从而降低系统实现的复杂度。

作者简介

马耀耀来自数据网格实验室BitXMesh团队研究方向:P2P网络、数据安全传输

参考资料

https://github.com/ipfs/go-bitswap/blob/master/docs/how-bitswap-works.md

https://github.com/ipfs/specs/blob/master/BITSWAP.md

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

银河链

[0:15ms0-1:808ms