一文读懂如何Filecoin存储选型

什么样的商业存储产品才能更适用区块链存储的应用?首先我们先要区分存储系统。市场上的存储系统有多种分类方法,常见的分类方式是按照架构和协议区分的。

布局IPFS矿机加V:czdn222

从架构上分为Scale-up集中式和Scale-out分布式两类。Scale-up架构受存储控制器扩展数量限制,常见的多为2控或4控的产品,其IO性能及磁盘扩展能力受限于控制器的数量。Scale-up架构的混闪和全闪存磁盘阵列,适用于对延迟较敏感但对存储容量和并发带宽要求一般的中小规模数据存储场景。

相反,Scale-out架构存储利用通用的以太网或高性能IB网络技术,存储节点的数量可以从几十个扩展到几百甚至几千个,其存储性能和容量并不取决于单个存储节点的能力,而是聚合集群中所有节点的资源。分布式存储系统就是Scale-Out架构最典型的产品形态。

存储系统从协议上可分为块、文件、对象等几种类型。块存储为上层应用提供卷级裸设备存储空间,存储资源具有独享性,延迟较低、单个卷的存储空间一般不超过几十个TB,适用于数据库、虚拟化等典型应用场景;文件存储为上层应用提供目录级共享存储空间,取决于不同的文件系统,单个目录的空间大小可从TB到PB甚至EB级,适用于各类非结构化数据应用场景;与文件系统类似,对象存储同样为上层应用提供共享的存储空间,用于非结构化数据存储应用场景。

数字资管公司Virtune推出瑞典首个实物支持的多资产加密货币ETP:5月2日消息,瑞典受监管的数字资产管理公司Virtune宣布将在纳斯达克斯德哥尔摩(Nasdaq Stockholm)上市第一个实物支持的多资产加密货币ETP。该ETP跟踪瑞典BMR指数提供商Vinter构建的Virtune Vinter Crypto Top 10 Index(VTOP10)。

此ETP是一种经过验证和测试的工具,可以被动地获得基础区块链协议敞口。实物支持意味着ETP中的所有资产都以标的加密资产完全抵押。VTOP10指数通过投资按市值计算的十大加密资产,为85%的加密市场提供风险敞口。

Virtune每月重新平衡指数,并在新加密货币进入指数时提供动态敞口。该指数对每项构成资产的投资上限为40%,以提高分散性。VTOP10 ETP将面向散户和机构投资者开放。(Globe Newswire)[2023/5/2 14:38:41]

所以适合海量非结构化数据的存储系统包括分布式文件和分布式对象两类,但两者在数据组织结构和访问协议等方面存在显著差异。由于海量非结构化数据应用场景非常多,对存储系统的要求不同,具体选用哪种类型的存储,还需要对分布式文件和对象进行更详细的分析和对比。

安永在深圳开设亚太技术实验室,创新领域包括区块链、Web3等:12月13日消息,安永会计事务所在深圳开设亚太技术实验室,该技术旨在利用新兴技术提升创新潜力,如AI、AR、VR、区块链、Web3等。该实验室目前已推出一种基于 Web3 的医疗保健数据分析模型,由去中心化身份 (DID) 规范支持,以帮助与主要制药公司合作运行合规、经过身份验证的医疗数据分析。(prnewswire)[2022/12/13 21:42:15]

成熟的分布式存储系统会随着业务场景的发展而不断完善。从起源上来看,分布式文件和对象都是随着大型互联网公司业务的快速扩张同步发展起来的,旨在解决其海量非结构化数据所带来的扩展性、可靠性和成本等瓶颈。

分布式文件系统

分布式文件系统的起源是Google于2003年发表的一篇论文《TheGoogleFileSystem》,其核心目标是设计一款具有高扩展能力和容错能力的高性能文件系统。该系统可以运行在廉价的商用硬件上,为前端大量客户端提供高性能、高可用的文件共享服务,解决海量非结构化数据的存储问题。

业界是这样定义分布式文件系统:基于一个单一并行文件系统组合多个存储节点为存储集群,为多个客户端的并发高带宽数据访问提供单一命名空间存储池。数据分散存储到集群中的多个节点上,基于数据自愈技术为客户端应用提供高可靠和高可用的数据服务,并可实现性能和容量的线性扩展。

Solana Labs:2.5亿美元社交媒体与游戏基金在过去一年只动用部分资金:11月28日消息,Solana Labs首席执行官Anatoly Yakovenko在里斯本Breakpoint 2022接受采访时表示,过去一年Solana Labs总计2.5亿美元的加密社交与游戏基金只动用部分资金进行部署,重点是小型种子轮投资,其中社交媒体基金方面到目前为止部署的金额“远不及一半”。

目前的社交媒体产品包括Dispatch、Squads、Dialect和Wordcell,且有37款游戏正在上线或准备上线。据悉,Solana Labs此前在Breakpoint 2021上宣布成立两只旗舰基金:一个是专注于去中心化社交媒体的1亿美元基金,另一个是用于鼓励区块链游戏的1.5亿美元基金。(The Block)[2022/11/28 21:05:49]

分布式文件系统具有如下几个显著特性:

1、?高性能

分布式文件系统利用存储集群中所有节点的处理和IO性能提供高带宽并发数据访问,成熟的商业产品聚合访问带宽高达TB级,可以支持数千甚至数万节点的并发访问。

2、?易扩展

分布式文件系统可以便捷地在集群中添加数据节点,实现存储系统性能和容量的线性增加,存储节点可以扩展至数百甚至数千个,存储容量扩展至数百PB甚至EB级。

Art Gobblers 24小时交易量在OpenSea和Blur排名第一:11月1日消息,NFT市场Blur数据显示,NFT项目Art Gobblers 24小时交易量达12228.85枚ETH,排名第一。Art Gobblers持有用户达1046名,地板价升至13.9 ETH。

OpenSea上Art Gobblers 24小时交易量为6149 ETH,位列第一,地板价达14.1 ETH。

据悉,Art Gobblers由热播剧《瑞克和莫蒂》(Rick and Morty)的配音演员兼共同创作者Justin Roiland与风险投资机构Paradigm共同创作。[2022/11/1 12:03:32]

3、?高可靠、可用性

存储系统不依赖于单个设备的可靠性,采用集群架构,确保系统中无单点故障;同时支持副本以及N+M纠删码等数据保护技术,确保数据可用性;存储系统具有一定的硬件故障与数据故障的冗余自愈能力。

4、?高性价比

存储节点基于工业标准商用服务器,硬件的成本大幅降低。

5、?开放兼容性

提供NAS、FTP、HTTP等通用文件共享访问协议。

Ledger联创将Ripple与Terra相提并论引发社区不满:10月25日消息,硬件钱包Ledger联合创始人Eric Larchevêque在TikTok上的一段视频中表示,由于高度中心化,与Ripple相关的代币甚至不是加密货币。 Larchevêque还将XRP与失败的Terra项目一起放一起。Ripple社区强烈反对这一评论,要求Larchevêque澄清他对Ripple的立场。一些会员表示,他们将放弃Ledger钱包。

对此Larchevêque在推文中回应称,Ledger非常支持XRP,上述观点并非是Ledger的观点,这只是在一次半开玩笑的采访中发表的愚蠢评论。Larchevêque还指出,在过去几年里Ripple发展了很多,就目前来看,这一事实使他的上述言论完全不公平。[2022/10/25 16:38:14]

分布式对象存储系统

分布式对象存储系统定义如下:以对象结构来存储数据的存储系统,前端服务器客户端通过协议或者API接口进行访问。从概念上来说,对象与文件一样,都包括内容和元数据。与文件相比,对象通常支持更丰富的元数据,用户或应用可为对象设置用于管理、数据挖掘和数据迁移的元数据属性。

?布局IPFS矿机加V:czdn222

分布式对象存储系统与文件系统的差异

与分布式文件一样,分布式对象同样采用Scale-out分布式集群架构,具有易扩展、高可靠和高性价比等优势,其与文件系统在使用上的不同主要体现在如下几个方面:

1、支持的存储访问协议不同

分布式对象采用更加专用的协议或者API接口进行访问,相比通用的NAS文件协议,需要前端应用做针对性的适配和接口定制开发。

2、支持的数据读写模式不同

与文件系统不同,分布式对象不支持数据的随机读取和写入,仅可针对整个文件做put或是get操作,这种模式基本把分布式对象限定在有限的数据写入后,有限的读取、极少修改的应用场景,例如互联网的云盘、备份归档以及法规遵从等温冷数据应用场景。

3、数据结构不同

文件采用树形目录结构,可以满足应用多级目录嵌套使用模式,但是随着嵌套层次和文件数量的增加,读取和存储数据时需要更长访问路径,当访问的文件过小时,单个文件访问性能受影响较大。

对象采用扁平目录结构,不支持多层嵌套的数据组织结构,只保留二级或是三级目录结构,只需要一个ID就能直接获取对象,这种数据结构在千亿级别海量小文件应用场景中会体现出一定的性能优势。

另外,对象目录结构更容易支持元数据定制,对象存储非常适合于与对象有关联性元数据的应用场景,对象存储允许为一个对象设置唯一的元数据属性,基于该元数据信息,可以从一个海量非结构化数据卷中快速的定位与读取该对象。

技术的发展并不是互相割裂、一成不变的,而是在相互借鉴中共同促进和发展。在分布式对象中应用比较广的N+M纠删码技术已成为分布式文件系统的标配,跨地域部署和数据容灾等功能也被越来越多成熟的分布式文件系统所支持。分布式文件系统利用高速SSD存储介质、元数据集群和小文件聚合等技术,支持的文件系统规模从十亿级向千亿级迈进,小文件访问性能提升明显;分布式对象也在利用高速SSD存储介质,进一步提升数据读取性能,从冷数据逐步向温、热数据应用场景推进。

分布式文件和对象的技术差异在逐步缩小。分布式文件由于其支持随机读写模式、协议的广泛兼容性、类似本地硬盘的展现形式更符合用户的使用习惯,在商业市场下有着普及性和大规模的应用案例,应用成熟度非常高。开源文件系统有Lustre、Gluster、BeeGFS和Ceph等,国内外专业存储厂商均开发了成熟的商用存储产品。

分布式对象受限于一写多读数据访问模式、专用的接口协议、扁平化的数据组织架构,其适用的应用场景远不如文件系统广泛。规模化的应用仅集中在有能力深度定制优化和开发的有限互联网场景中,比如Facebook自研的用于海量图片存储的HeyStack、Amazon研制的支撑其云业务的S3等。从技术实现层面而言,分布式对象的实现难度较低,开源产品有Ceph、Swift、Minio等,主要应用场景归纳如下:1、结合云应用提供业务数据的备份归档存储;2、金融证券、医疗等行业应用的法规遵从性文件的归档。另外商用的对象存储应用多以小规模、冷数据等限制性场景为主,对于数据写入和读取的实时效率要求并不高。

去中心化存储系统的“成色”由存储规模、数据IO性能、可靠性、在线扩容时间、数据重建影响等几个要素直接决定,具备大规模部署案例的分布式存储产品才能够经得起此类应用长期的考验。

布局IPFS矿机加V:czdn222

从区块链IPFS实际应用的技术需求来看:

1、采用分布式对象存储意味着应用需要根据存储厂商对象接口API或SDK单独开发与维护。当前去中心化存储应用中,上层软件多样且迭代速度较快,已有软件环境也存在着频繁强制升级的现状,任何上层软件的变更都可能导致对象接口的迭代完善甚至重新开发,工作量巨大,运维

2、行业内大部分分布式对象系统是基于开源Ceph构建,以Ceph为代表的对象存储系统一般仅支持基于连接数的负载均衡策略,而商业全自研的文件系统可支持基于连接数、存储容量、节点负载等多维度的存储负载均衡,在多并发、存储性能异常时,可根据实际场景选择更优的负载均衡模式,以提升存储效率。

3、实际应用中1个扇区文件大小是32GB。对象存储单次put上传的对象最大为5GB,对于32GB文件,对象存储系统必须在客户端上拆分成多段后,再进行并发传输;多个分段上传至存储系统后,再次合并成最终的Sector。多个Sector合并过程势必会对存储性能和数据抽取时间有较大影响,直接会影响WinningPoST完成时间,从而降低出块效率。

4、扇区文件和扇区索引文件存在关联性,若采用优化手段增强其关联性,则会极大提升存储性能。对象存储需要多个桶分别存储扇区文件和扇区索引文件,一般需要通过人为设置桶的属性及大量桶之间的关联绑定。业务数据量增长迅速,额外的设置与调整,同样给业务运行及系统运维造成极大影响,这在实际应用中也是很难完成的。

布局IPFS矿机加V:czdn222

综上分析,基于应用当前需求和特点,Filecoin的存储系统更适合采用成熟的分布式文件系统构建。另外,同时支持文件、对象、块协议的分布式统一存储将成为发展趋势,也为去中心化存储未来的多模式应用提供了技术可行性。

最后,笔者认为在选择合作的存储厂商时,首先,应关注其是否有专业的存储研发团队和完善的技术服务体系;其次,应具备超大规模系统部署和运维经验、快速应用适配定制和深度优化实力;最后,有着长远的分布式存储产品发展规划和资源投入。这样的存储厂商才能帮助用户搭建长期可靠的数据存储环境,支持去中心化存储市场和应用的快速发展与普及。

来源:金色财经

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

银河链

XMR币沐岩:2.4以太坊一路领涨 比特币大方向依旧看涨

前期由于一些私人原因,很多天没有更新文章了,很感谢一直以来关注和支持沐岩文章的币友们,你们的支持是我写下去的动力,同时也希望沐岩的文章,能在投资路上给各位币友带来一些正面的参考建议,往后的投资路上,沐岩依旧陪伴在你左右.

[0:15ms0-2:303ms