撰文:Betty、YY研究员:JamesKuo、NoiseZhou、Lightmanben均就职于LDCapital
摘要
线下生活的线上化及如火如荼的所有者经济催生了巨大的数据存储需求,具备巨大的商业和应用前景;中心化存储由于高昂的成本、预置的存储格式等因素难以跟上数据指数型增长所带来的存储容量、数据读写速度、安全性和数据关系的变化,由此去中心化存储应运而生;去中心化存储基于区块链技术,具有可扩展性强、安全、效率高、自动容错、可靠性高、成本更低的特性;Web3.0的世界里,用户海量的线上足迹和创作的线上作品创造了一个难以置信的巨大的数据王国,而这数据王国的维持依赖一个可靠稳定安全的数据存储网络;元宇宙辉宏的世界里,货币化的虚拟物品若失去可信任的区块链链上存储的保护,一旦其对应的元数据和媒体数据失效或被篡改,则将会变成一张没有承兑方的无价值支票;现时主要的去中心化存储方案为IPFS/Filecoin和Arweave项目,IPFS开创性地引入了激励层Filecoin以确保数据在约定期限内的可靠存储,而Arweave通过技术创新以期实现数据在链上的永久保存。2021年的夏天,一组由一万个不规则像素组成但看起来很奇怪的小人忽然兴起,让人惊讶的是其单个头像却能以等价于几千万美金的以太坊成交;此后BoredApeYachtClub、Loot等成为加密市场的新宠。从加密艺术、游戏到头像、文字,NFT的兴起引燃了人们对元宇宙、对Web3.0的无尽想象。
然而当我们在谈论作为身份象征的CryptoPunk、兴致勃勃地边玩边赚游戏AxieInfinity、酣畅淋漓地构想在元宇宙里星辰大海的征途时,我们是否想过这些数据会被存储在哪?是否担心这些数据可能会被篡改?没有人会希望花了几千万美金的头像因为底层数据的篡改而一文不值,没有人会希望在元宇宙里与朋友对话的珍贵回忆因为系统宕机而永远消失。站在元宇宙和Web3.0纪元的起点,在数据爆发式增长的今天,我们急需一个安全、开放、自由、可靠的存储网络。
本文将通过介绍存储之于Web3.0及元宇宙的深刻意义,尝试向读者描绘去中心化存储在Web3.0及元宇宙中激动人心的应用。同时,本文还将立足于去中心化存储的发展现状,对不同的去中心化存储方案进行研究和比对。
存储的产业生态
新冠疫情的肆虐加速了真实世界与虚拟世界边界的模糊,人们在真实世界中的工作、社交、娱乐、餐饮、购物、出行等活动几乎都可以在互联网世界中来执行;同时,从Web1.0到Web3.0,从被动的数据读取到热火朝天的内容创作,数据生产量发生了爆炸式的增长,并且还将以指数形式继续增长。据360研究报告,全球数字内容创作市场预计将在2025年达到169亿美金市值。如火如荼的所有者经济模式和指数型增长的数据创造了巨大的数据存储需求,芯片技术、算法、硬件等的发展促进了存储技术的进步,而数据价值的释放和数据安全的刚需又倒逼存储技术的创新和基础设施建设。在软件及算法的迭代与融合中,存储行业从传统的磁盘存储突破硬件的物理限制而逐渐演进到云存储。作为区块链技术的三大支柱之一,存储对于Web3.0与元宇宙的发展都具有重大意义——从应用角度来看,数据安全与数据主权的最终归属关系着虚拟世界的稳定运行;而从经济角度来看,元宇宙与Web3.0世界产生的海量数据存储需求也有着巨大的商业前景
于佳宁:FTX大崩溃后,我们可以更加信任去中心化:金色财经现场报道,由Coinlive、Beosin和FOMO Pay主办在新加坡举行的“在动荡的行业中讨论数字资产的未来”活动中,火大教育校长于佳宁博士发表了第一个主题演讲。他就“数字资产的趋势和周期”这一主题分享了他的观点。他谈到了Web3和元宇宙的黄金时代。Web3是继Web2(移动互联网)之后的一个新的“第二曲线”,目前的非连续性创新的窗口期是创新创业的黄金时代。同时,他还列举了元空间应用的七个要素,包括数字空间和数字建筑、VR/AR和沉浸式体验、元人(数字人)、NFT和数字藏品、数字身份和化身、CBDC和DeFi以及数字孪生。数字资产是未来智能经济的基础,正如移动支付给各行各业带来了巨大改变,数字资产和区块链有望将信息流、资金流、实物流融为一体,实现“三流合一”。他表示,对他来说,数字资产的前景是积极的,特别是在FTX的大崩溃之后,去中心化的服务将有更大的发展空间,也更值得我们信任。[2022/11/25 20:46:06]
全球数据产生量走势图,来源:www.slideshare.net/PerryLea/the-20-rule-how-the-seismic-growth-of-data-has-always-and-will-always-outgrow-telcom
碍于各种因素我们现时无法整体评估存储市场的规模,但以云存储为例,预计到2027年,全球云存储市场规模将达到2,222亿美元,在预测期内年复合增长率达21.9%(SnehaKoradRachitaRake&VineetKumar,2021)。
全球云存储行业市场规模预测,来源https://www.alliedmarketresearch.com/cloud-storage-market
存储的商业模式分为中心化和去中心化存储,中心化存储是将数据完整地存储在中心化的服务器上,去中心化存储则是采用分布式存储技术将数据切片分散存储在多个独立的存储供应商上。中心化存储方案以高稳定性的性能、低廉的费用,满足了企业级存储的需求;去中心化存储以其定制化存储方案、经济激励模型、隐私性强等特点满足了长尾企业市场的特殊场景要求。站在Web3.0与元宇宙的交汇处,对数据安全性和用户数据所有权的重视,去中心化存储的重要性将愈发凸显。
Ergo去中心化智能合约矿池GetBlok SmartPool上线:据官方消息,近日,Ergo去中心化智能合约矿池GetBlok SmartPool已上线。它是一个100%去中心化的矿池。Ergo矿工可以将其资源形成矿池并利用智能合约获得稳定透明的付款和会员资格。目前,GetBlok SmartPool已通过众筹平台Ergo Raffle筹集到144.5枚ERG来鼓励矿工加入该矿池。如果找到区块或找到区块无效,加入该矿池的矿工均将获得奖励。找到区块的矿工还将额外获得5枚ERG。[2021/11/17 21:58:44]
中心化存储
中心化存储,即将整个存储集中在一个系统中的多套设备上,是过去大型主机时代的产物,采用有限的固定的节点数,数据访问仅需经过一个控制器,因而具有低延迟的优点但相对费用较高、数据安全性、服务提供商的运营可扩展性低等问题。
中心化存储系统顺利运行的关键之一是存储服务器稳定运转,存储服务器成为系统性能的瓶颈以及可靠性的焦点,对于存储环境、硬件设备等提出了极高的要求,因而巨大的中心化存储市场却是巨人的蛋糕,亚马逊、微软、谷歌、阿里云四大巨头合计占据了云存储市场份额的67%。
2021Q1全球云存储提供商的市场份额
随着微博、Facebook等的传播以及自我内容创作的流行,我们进入了数据以指数倍增长的时代,爆炸式的数据增长对存储容量大小、扩充速度和数据备份等方面提出了更高的要求;用户间实时的信息互动需要更快的数据读写速度和更高的安全性;同时,由于用户自我创作产生的数据种类、数据间的关系变得更加复杂多样化,存储系统需要从过去单一的文件类型扩展至各种半结构化、非结构化的数据关系。而中心化存储由于其高昂的建设成本以及行业进入壁垒,数据存储容量、数据类型等的扩张都难以跟上数据生产的脚步,去中心化存储由此应运而生。
去中心化存储
就如IPFS(InterPlanetaryFileSystem)早期布道者胡飞瞳所说:「在中心化数据存储的世界里,用户不仅为数据存储付费,而且还得不到很好的数据保护,这一现象必须改变。通过去中心化,用户可以自己管理自己的数据、加密存储、授权访问、安全备份等等特性的实现将极大地加强用户的隐私,也能增强数据的长期保存,同时,有望通过共享的模式大大降低费用。这是数据存储发展的必然方向。」
去中心化存储基于区块链技术,采用开源的应用程序和算法,把数据切片分散存储在多个独立的网络节点上,主张隐私保护、数据冗余备份等,并且通过对种子节点或文件上传方提供经济激励使数据价值化。其中,经济激励模式使得用户数据得以安全长久地保存正是去中心化存储的点睛之笔。
当去中心化存储遇上区块链技术,便具有了可扩展性强、安全、效率高、自动容错、可靠性高、成本更低的特性:
Algorand将采取共识升级投票机制对去中心化治理计划进行全网公投:公链Algorand将采取共识升级投票机制对去中心化治理计划进行全网公投,所有参与共识的Algorand在线账户都能参与此次公投。
用户可通过注册账户并运行共识参与节点进行投票,如果在15000000区块高度(预计2021年7月14日)时或在此之前,升级版本被网络所接受,该公投就会通过。如果去中心化治理公投通过,第一期治理将于2021年10月1日开启。用于给初始阶段满足所有标准的治理者的奖励池总额为1.318亿ALGO。参与此次公投没有额外奖励。[2021/6/11 23:30:34]
可扩展性:存储节点的数量可无限扩展,每个节点的存储容量亦可灵活调整;安全性:无需了解合作对方或寻求第三方的信任,存储信息拆分成碎片分散存储在多个节点,存储数据的加密不仅局限于用户和软件终端,而且在存储网络的所有环节中、在信息传输过程中通过私有网络访问密钥、零知识证明等方法进行加密处理;高效率:同一网络上的节点可直接共享文件;自动容错:由于存储内容已分散到网络中的许多节点上,可在数据传输或存储出错时存储额外的副本;高可靠性:存储系统内含的验证机制能确保文件被完整真实地存储,且能7*24小时供用户随时取用;低成本:据悉,存储一期《中国有嘻哈》视频文件,按0.001美元/GB带宽成本计算,则爱奇艺需支付给传统存储商一百万美元,若采用IPFS分布式传输则可节省60%的带宽成本。
去中心化存储:Web3.0与元宇宙的交汇之处
去中心化存储与Web3.0
互联网的起源可以追溯至1989年万维网的诞生,如果说门户网站开启了Web1.0时代,那么2003年博客的兴起标志了Web2.0的开端。从Web1.0到Web2.0,从被动的信息接收到自主创造内容与在线交互,互联网用户呼唤更注重用户内容创作、易用性和互操作性的应用体验,Web3.0呼之欲出。正如蒂姆·伯纳斯·李所说,「人们一直在问什么是Web3.0。我想也许当你在Web2.0上有一个可扩展的矢量图形覆盖层——所有的东西都在荡漾、折叠、看起来模糊不清——并且可以访问一个集成在巨大数据空间中的语义网络时,你就可以访问一个难以置信的数据资源」。虽然现在我们还未对Web3.0达成一致的定义,但Web3.0应该具有以下特征:
开放性:由开放和可访问的开发人员社区构建开源软件,并且链上进行的操作能被所有人查看。去信任化(Trustless):网络本身允许参与者在没有可信第三方的情况下公开或私下互动。Web3.0通过去中心化的激励机制保证参与者遵守规则,在交易中利用区块链协议的共识机制验证账户的真实性和转账的有效性,达成去中介化的价值转移。去许可化:任何人,包括用户和供应商,都可以在没有管理机构授权的情况下参与。
Draper Goren Holm推出WordPress插件可实现去中心化加密交易:加密风险投资公司Draper Goren Holm推出WordPress插件,可在基于WordPress的网站和博客上实现去中心化加密交易。注:WordPress为著名开源博客软件和内容管理系统,是当前因特网上最流行的内容管理系统。(Decrypt)[2020/4/22]
互联网的演化
Web3.0的星辰大海里,数字世界与物理世界的边界正在模糊。用户海量的线上足迹和创作的线上作品,如果没有一个稳定可靠的数据存储网络在背后默默地记录下,当我们兴致勃勃地回望Web3.0世界里所发生的一切,那时可能只剩下一片模糊的碎片。
去中心化存储与元宇宙
2021年随着Roblox上市「元宇宙/Metaverse」概念忽然席卷了互联网、VR/AR和金融投资界等各大行业,借着微型计算机、VR设备和以5G为代表的高速网络技术的兴起,人们来到了元宇宙纪元的门口。正如我们上一篇爆款研究报告《Metaverse全景透视:从过去看向未来》所说:元宇宙世界的点睛之笔正是其经济系统。其一,基于区块链的开放式支付和清算系统,可以满足用户在元宇宙世界的实时、公平、透明、快速的P2P支付需求;将元宇宙中用户的虚拟物品或创新成果货币化,不仅赋予了用户与真实物理世界近似的权益保障,更能极大地促进元宇宙资产的流通、交易并鼓励用户通过持续创新来获得财富积累。而这背后,在元宇宙辉宏的世界里,庞大的用户信息交互及创作的虚拟物品信息如若失去可信任的区块链链上存储的保护,一旦其对应的元数据和媒体数据失效或被篡改,那么用户手上的NFT所有权凭证将会变成一张没有承兑方的无价值支票。
TheSandbox游戏内虚拟资产,数据源:TheSandbox
主要的去中心化存储解决方案
Bittorren
最早期的去中心化传输方案为Bittorrent,即BT下载,由软件工程师BramCohen于2003年提出,通过P2P下载的方式克服了传统下载方式的局限性——不需要资源发布者拥有高性能服务器来传输资源,且下载同一文件的人越多下载该文件的速度越快,加上其免费使用这一收费模式,吸引了众多的网民使用。然而Bittorrent下载必须使用种子文件,即下载内容的所有地址放到这个种子文件中才能下载,且客户端只能下载种子文件内的内容。但种子文件可能随着时间推移而减少甚至消失,这也意味着存储的内容可能会在传播中消失。Bittorrent的另一个明显的问题是缺乏激励机制,缺失激励用户无偿共享文件的动力。在适当的经济激励缺席下,只有那些广受流行且不断有人下载的内容才能幸存下来,而某些未能引起大众注意的精华则可能消失在历史的长河中,只留下一抹模糊的剪影。
动态 | 外媒:个人用户对XRP消极是由于其并不是真正去中心化的货币:CCN发文探讨企业以及个人用户对XRP态度不一的原因。其表示,通过使用XRP,银行等机构在实现跨境支付时将中间人排除在外。而没有第三方参与,成本将大大降低。同时,企业对XRP感兴趣的的另一个原因是其可扩展性。而多数个人用户讨厌XRP,是因为其认为这是银行家的加密货币。通过与金融机构合作,它偏离了中本聪(Satoshi Nakamoto)的点对点货币愿景,使人们能够从银行取回控制权。[2019/5/19]
IPFS/Filecoin
IFPS是2015年提出的另一去中心化存储方案,克服了bittorrent的不足——仅用hash地址即可寻找到所需文件、可存储内容的多个版本、可预下载内容,进而实现去中心化、快速、高效率、可靠性、安全的内容存储。值得注意的是,IPFS又开创性地引入了激励层Filecoin,通过通证激励机制以确保文件在约定期限内的可靠存储。
Filecoin允许任何个体利用空闲的硬盘空间和带宽在公开市场上提供数据存储和检索服务,将未用硬盘容量货币化,并通过PoRep和Post来保证矿工真实存储文件的情况,防止女巫、生成、外包等虚假存储数据的攻击。简单来说RoRep是证明矿工真实存储了数据,而Post则是证明矿工一直将该数据存储在自己的硬盘中。运作原理如下图:用户通过发布订单寻找合适的存储矿工,数据加密并分割后发送至矿工,矿工将该信息添加至存储区块进行存储并持续证明其工作以获得奖励。
IPFS工作原理图,图片来源:https://www.8btc.com/article/613165
当然,Filecoin的这种模式并不意味着它就是完美无缺的。IPFS挖矿需要专业设备—GPU矿机而使挖矿成本较高,行业进入壁垒的提高导致普通个体可能无法直接参与存储挖矿,进而全网总存储将向少数存储供应商或大规模矿池集中。这从某种程度上来说,IPFS所构想的完全去中心化在执行过程中又变成了少数供应商垄断的「中心化」存储。
Filecoin主网于2020年10月上线,目前已有3,175个活跃节点,主要遍布于北美、欧洲、中国、韩国等。截止21年10月14日,Filecoin全网提供了12.393EiB有效算力,当前基础费率为0.1052nanoFIL,封装32G存储花费4.958Fil/TiB。
Filecoin节点分布图,图片来源:filscan.io/statistics/map
Filecoin基线与算力走势图,图片来源:filscan.io/statistics/map
伴随着filecoin底层网络和基础设施的完善,其网络效应发展的前期红利吸引了更多的应用来布局。截至目前,filecoin已建立起一个涵盖「消费者存储应用、数据市场、数检索、NFT、Defi、可验证存储和隐私」等领域的生态环境,如Fileswan、NFTStororage、Opera、Livepeer等项目。
Filecoin生态图,图片来源:https://github.com/filecoin-project/community/discussions/194
Arweave
与Filecoin将数据存储在链下不同,另一存储方案Arweave将数据内容直接存储在区块网中,是主打永久存储+链上存储的去中心化存储方案。如下图所示,Arweave方案分为两层架构:底层的区块网络Blockweave和上层基于HTTP构建的Permaweb。Arweave项目的技术亮点正是其底层Blockweave网络:
Blockweave:项目采用了全新的区块链网Blockweave——基于共识机制和特定的出块模式,即将之前所有区块的哈希值做成一个哈希列表并将系统中所有活跃钱包做成一个列表,矿工通过检索哈希列表和钱包列表来完成验证工作,而无需像BTC、ETH等节点一样去验证整个节点,这种方式减少了能源消耗并提高了节点工作效率。
激励算法Wildfire:与Filecoin需要持续性地收取存储费用不同,Arweave只在数据写入时收取一次性的永久存储费用,之后用户读取数据都是免费的,为了鼓励节点对数据读取请求作出响应,Arweave引入了激励算法widfire。简单来说,Wildfire就是一个节点评分系统,根据节点发送新交易和区块的次数以及响应请求的速度来让每个节点对其他节点排名。从相邻节点得到的可靠数据越多则给对方的评分就越高,相应地出块概率就越大。
智能网SmartWeave:SmartWeave将智能合约执行的计算负担从节点转移到了用户,即Arweave网络中只存储了应用程序的所有数据,这些数据将以代码的形式提供给浏览器或其他客户端应用程序,因而使得Arweave能支持需要大量计算的Dapp。
Arweave架构
虽然Arweave存储方案将数据保存在链上,能保证数据的不可篡改、「永久存储」和所有人公开访问;然而这种模式也具有一定的弊端。其一,数据的不可篡改导致任何改动都只能通过上传新数据,这将造成一定的迭代成本。其二,为了保证数据的永久存储,Arweave需要不断吸引新的节点加入同时确保节点的边际收益大于边际成本,然而Arweave节点数一直在减少,目前仅有146个节点,较2020年5月的490个节点减少了70%。
Arweave节点分布图,来源:https://viewblock.io/arweave/stats
Arweave主网于2019年1月29日上线,并于2020年5月推出具有捆绑交易存储功能的Arweave2.0版本,链上交易量在2021年开始发力并于今年9月达到顶峰(9月日均交易量超8万笔)。Solana上MetaplexCandyMachine的推出以及ipfs2arweave跨链桥的推出等造就了Arweave的亮丽表现。
Arweave交易量统计,来源:https://viewblock.io/arweave/stat/txCountHistory
纵观Arweave生态项目,目前较为活跃的是NFT、DeFi及基础设施赛道,如Koii、Limestone等项目,目前生态还处于建设的早期阶段。
Arweave生态一览
展望
站在Web3.0与元宇宙的交汇处,对数据安全性和用户数据所有权的重视,去中心化存储的重要性将愈发凸显。去中心化存储与中心化存储在存储空间来源、带宽来源、安全性、使用方式等多个维度的差异,导致现时去中心化存储的规模和性能远远不如中心化存储系统。虽然IPFS、Arweave等项目通过不同的「非中心化」设计方式弥补了其不同的缺陷,并引入通证激励使全网存储总规模扩大,但是项目方与用户的利益不一致、费用结构的等因素阻碍了项目的快速拓展,其生态构建尚处于早期阶段,未来需要在费用、节点量、用户量之间找到平衡,实现规模与性能的兼顾。
去中心化存储方案的对比
我们期待随着元宇宙和Web3.0纪元的开启,网络的「飞轮效应」使去中心化存储能迎来应用爆发的浪潮,期待存储技术的改进和经济激励模式的优化,去中心化存储这一赛道能有长足稳定的发展。
参考文献CloudStorageMarket(2021),SnehaKoradRachitaRake,VineetKumar,https://www.alliedmarketresearch.com/cloud-storage-market分布式存储——千亿存储市场的蓝海大战,https://www.8btc.com/article/6131652020分布式存储产业链研究报告,焦仕可https://www.jinse.com/news/blockchain/835473.htmlA'morerevolutionary'Web(2006),VictoriaShannon,https://www.nytimes.com/2006/05/23/technology/23iht-web.htmlWhatIsWeb3.0&WhyItMatters,FabricVenture,https://medium.com/fabric-ventures/what-is-web-3-0-why-it-matters-934eb07f3d2bIPFSandFriends:AQualitativeComparisonofNextGenerationPeer-to-PeerDataNetworks(2021),ErikDanielandFlorianTshorsch
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。