短期来看,Web3驱动的分布式算力的实现难度高,但是中长期看,这个是一个必然的结果和选择。
原文标题:《A&T前瞻:为什么Web3驱动的分布式算力网络是元宇宙的基础设施?》
撰文:Rosie,A&TCapital高级投资经理
Intro
根据网上对元宇宙的定义,元宇宙是利用科技手段(AR/VR/MR/XR等)在与现实世界映射或3D虚拟世界里进行链接和创造。笔者建议,把元宇宙看作与真实世界平行的空间,通过不同的技术手段,可以建立趋近于无数个平行的空间。AR/VR/MR/XR产业带来的不仅仅是对硬件交互的颠覆,也给人类对空间的理解和在空间的使用上带来了新的可能。
随着明年苹果推出名为Reality的MR设备,Meta不断迭代其Oculus的VR,国内的Rokid、光粒、Nreal等AR设备厂商也在纷纷出货,我们已经站在元宇宙爆发的前夕。本文基于对元宇宙硬件发展的理解,推导元宇宙应用大规模爆发时对计算和传输的要求,论证为何Web3和分布式算力将成为元宇宙时代的计算基础设施。
元宇宙的发展现状?
以内容作为驱动整个生态发展的底层逻辑,内容与计算和存储咨询交互,通过传输,内容到达AR/VR/MR/XR硬件设备。用户通过使用终端硬件进入元宇宙。本篇文章讲AR/VR的发展,重心主要落在计算和传输,存储是另外一个大话题,将在后续文章里单独进行分析。
Web3技能招聘平台CV Wallet完成110万美元天使轮融资:金色财经报道,Web3 技能招聘平台 CV Wallet 宣布以 700 万美元估值完成 110 万美元天使轮融资,该公司旨在通过 Web3 和人工智能技术创建一个更公平、更高效和值得信赖的招聘生态系统,并且利用 Web3 技术来验证简历内容真实性并保持招聘过程的诚实性。(bmmagazine)[2023/4/25 14:26:05]
硬件
AR/VR设备是用户进入元宇宙的硬件入口。
AR
AR全称AugmentedReality/增强现实,即利用计算机模拟将虚拟物体叠加在真实环境里,使他们在同一画面和空间存在。
AR的技术趋势为光波导+MicroLED。
VR
VR全称VirtualReality/虚拟现实,即利用计算机模拟生成3D虚拟世界,向提供使用者近似真实的感官模拟。
VR的技术趋势为折叠光路+MicroOLED。
虽然AR和VR的具体技术路线有差异,但是总体的技术框架相似。两者都是需要通过选择光源和成像方案,将图像呈现在显示屏幕上,给用户从视觉上制造沉浸感。
本篇文章对沉浸感的定义,是人对计算机系统创造和显示出来的虚拟环境的感受无限趋近于人类对真实自然环境的感受。为了实现最高沉浸感,也就是最趋于人对真实世界感知的感受,对AR/VR设备的显示要求是类视网膜的要求。AR/VR设备的显示屏有2个重要参数直接影响用户的沉浸感:
分辨率/Resolution这里先提一个单位,叫做PPD(PixelPerDegree),它决定显示的清晰程度。与传统屏幕不同,AR/VR等近眼设备采用PPD衡量屏幕的清晰程度,PPD代表视野中每一度视场角的像素密度。类视网膜的屏幕需要达到60PPD。另外一个需要理解的是FOV(FieldofView)/视场角,也可以理解为视野。假设单眼横向FOV为110°,纵向约120°:2*(110x60)x(120x60)按照分辨率定义,也就是一块差不多13k的屏幕才能满足类视网膜的显示需求。
Coinsilium:Multiverse NFT标准(ERC-5606)在以太坊上获得批准,以增强Web3资产互操作性:3月20日消息,Web3风险投资商Coinsilium Group Limited表示,继去年9月提交EIP-5606(以太坊改进提案)之后,由Metalinq技术团队开发的新“Multiverse”NFT标准ERC-5606已成功完成以太坊社区批准程序。ERC-5606是在多个元宇宙、Web3游戏和平台上创建多元NFT的新标准,这些NFT可以代表不同虚拟世界中的独特资产,从而实现在这些世界之间的互操作性。ERC-5606完全兼容NFT标准ERC-721和ERC-1155。
Metalinq是一个由Coinsilium和Coinsilium投资组合公司Indorse的创始团队支持的项目,正在构建增强Web3资产的互操作性的技术解决方案。[2023/3/20 13:15:03]
刷新率/RateofRefresh可以用fps(framepersecond)理解,也就是每秒里面有多少帧图像(一帧就是一张图像)。见下图,当fps低的时候,人眼看到的物品的移动是不连续的。随着帧数增加,人眼感受到的是物品在连续的移动。
引用:《FrameRate:ABeginner’sGuideforLiveStreaming》
当fps低的时候,人会因为画面的不连续产生晕眩感。所以通过提高fps能降低使用AR/VR硬件感受到的晕眩感。当达到60fps的时候,基本上不会产生晕眩;当达到144fps的时候,就能达到人眼能察觉的最高极限,也就达到了人类感知真实环境的效果。
用户数量
IDC公布2021年全球AR/VR出货量达到1,120万台,同比增长92.1%。如果与智能手机的出货量做类比(见下图),我们正所处在AR/VR时代爆发的前夕。
Audacity推出6000万美元新基金,专注于Web3创作者经济和游戏等领域:7月26日消息,风险投资公司Audacity宣布推出6000万美元专注于Web3创作者经济及游戏等领域的新基金,旨在通过对一些媒体科技公司提供资金支持来弥合内容创作者从Web2到Web3的差距。
Audacity创始人Kabir Kochhar表示,虽然Web3应用层仍处于初期阶段,但随着媒体生态系统引入用户,Web3主流化速度将会加快,该公司将专注于美国和亚洲市场并参与种子轮和A轮阶段的融资交易。(acrofan)[2022/7/27 2:39:26]
随着AR/VR总出货量的增加,越来越多的用户将通过AR/VR设备进入元宇宙,同时使用AR/VR设备的在线人数会随之增加。
现状和痛点
沉浸感是通过使用计算机生成的3D虚拟世界或是通过图像生成三维重建世界,投射在2D屏幕上让人感受到距离、光影、色差而得到的。3D虚拟世界是使用专业的建模软件(如unity)生成的,而3D世界(包括三维重建的世界)及里面的模型如何成像在2D屏幕上是由渲染决定的。渲染是元宇宙世界里使用最多算力的计算工作类型。渲染算法通过一系列参数(例如光照角度、强度等)计算出模型该有的阴影、颜色灰度等,生产出一张张让人眼看上去与真实世界非常相近的图片。用户在AR/VR设备里看到的其实是渲染好的图片流。现在做渲染的方式大类有三种(见下):
本地主机:也就是应用程序跑在AR/VR设备里,直接使用AR/VR设备的硬件进行渲染,渲染完成后直接推图片流到AR/VR设备里的显示屏。本地主机渲染架构有几个大的痛点:
加密管理平台Finoa与Outlier Ventures合作打造web3产品:金色财经报道,欧洲加密货币提供商Finoa宣布开始与区块链的风险基金和加速器平台Outlier Ventures 合作专注打造web3 产品。通过此次合作,Finoa 将支持具有机构级端到端解决方案的项目,以管理加密投资和运营。Outlier Ventures 是首批致力于投资新兴加密生态系统的风险投资公司之一。该合作伙伴关系将通过 Finoa 的直观界面为 Outlier Ventures 的加速器参与者提供专业的加密货币托管和管理服务。通过使用 Finoa 平台,加密项目可以最大限度地降低通常与早期加密资金管理和运营相关的风险、运营开销和摩擦。(cryptoninjas)[2022/3/31 14:29:30]
AR/VR应用程序包大,导致在主机端无法同时下载和存储多个应用;
AR/VR主机厂的因为需要控制设备成本价格,不会选择在主机上安装很多计算资源,因此,AR/VR设备不能满足对渲染要求高的场景的应用程序,限制了能在AR/VR设备上运行的应用程序数量和类型;
AR/VR设备与人体接触,需要维持其运行的温度在人体能接受的区间,如果做太多本地计算则会使其温度上升,让热管理成为一个问题;
由于是佩戴型设备,如果在本地做太多计算,用电速度则会加快,导致用户需要频繁充电,降低了用户的佩戴时间。
基于上述的几个痛点,AR/VR内容提供商和主机厂普遍建议不要在本地做太多计算。
串流:也就是应用程序跑在用户的电脑里,使用电脑的硬件进行渲染,渲染完成后直接推图片流到AR/VR设备里的显示屏。串流架构最大的痛点在于渲染速度限制于用户的硬件参数。非常少量的用户拥有能做到13k/img/20230515172353635435/5.jpg "/>
2021年全球GPU总出货量加保有量大约是4亿颗,预计到2025年年底GPU总出货量加保有量大约是~15亿颗。假设云厂商拥有全市场30%的算力,按照同比例,云厂于2021年拥有1.2亿颗GPU,于2025年拥有4.5亿颗GPU。
根据分辨率和fps的要求,算出每渲染一张照片每秒同时使用多少颗GPU;再从总GPU数量,算出支持全球同时在线的AR/VR设备数量。可以看到,当渲染计算强度是类人眼时,也就是渲染算力需求是13k/img/20230515172353635435/7.jpg "/>
引用《3D可视化入门基础:看渲染管线如何在GPU运作》
Application阶段:在CPU端执行,通常用于准备绘制所需的几何数据、Uniform数据等,并发送给GPU端;
GeometryProcessing阶段:又可以拆分为顶点着色、细分着色、几何着色、StreamOut(用于将GeometryProcessing阶段处理的结果写回到Buffer中)、裁剪(将超过NDC的坐标裁剪掉并生成新的顶点)、以及屏幕映射(ScreenMapping,将NDC坐标映射到屏幕坐标);
Rasterization(光栅化)阶段:将上一阶段处理的图(点,线,三角形)转变为一个个离散的像素块;
PixelProcessing阶段:将光栅化生成的像素进行着色(PixelShading),之后将计算好的像素根据一定规则写入到framebuffer或者开发者指定的buffer中。
在这些步骤里,有几步是可以被并行处理的,例如像素着色、顶点变换、图元组装或者通用计算等。这些可以被并行处理的计算可以被发送到不同的节点上进行工作,利用分布式节点的算力,成为元宇宙的计算基础设施。
如何成为元宇宙的基础设施解决算力焦虑
在上文里提到,当渲染强度是类人眼时,也就是渲染算力需求是13k/img/20230515172353635435/8.jpg "/>
云厂商的GPU资源还是会被充分利用,但是作为generalcomputeresourceproviders,GPU资源除了被渲染使用,还有很大一部分会被AI相关的领域所使用,所以需要调动更多的计算资源;
通过激励模式,让更多的节点加入算力网络。通过评估网络里不同节点的算力的强度,分发相应的渲染工作;
AR/VR端最终会收到多个节点推来的照片流。AR/VR端只需要对这些照片流进行排序即可在显示屏上显示给用户。
传输
理论上来说,电信号的传播速度是光速,由于物理距离带来的数据传输延迟高的原因在于这些信号在传输过程中会有损耗,因此,长距离传输需要经过「中转站」。这些中转站在收到数据后需要把这个数据的信号加强,还原成刚发出的信号。因为这个过程需要时间,所以总的来说是地理距离越远,延迟越高。
如上图所示,当用户端1在离云厂商的机房物理距离远时,选择使用就近的分布式网络节点完成渲染任务;
用户端2在离云厂商的机房物理距离近时且离某些分布式节点近时,选择混合渲染方案,即中心+分布式方案;
AR/VR端会接收多个节点推来的图片流,完成排序后,显示在屏幕上。
Tokenomics+PoPW
使用tokenomics激励全球的网络用户加入算力网络,PoPW的共识协议确保数据的正确性和完整性。
Tokenomics用于基础设施网络有两个好处:
能够在全球范围内快速扩展网络,更好的响应全球的渲染工作的需求;
大型物理网络需要资金投入,不管是前期购入硬件成本还是后期的运维和维护成本。通过使用tokenomics构建和维护网络并将收益全部分配给供应方是一种更具成本效益的解决方案。
分布式算力市场Mapping
总结
笔者认为,短期来看,Web3驱动的分布式算力的实现难度高,不管对于渲染模型、降低使用的GPU门槛、还是传输,还需要时间发展。但是中长期看,这个是一个必然的结果和选择,将会支持元宇宙大规模爆发,成为元宇宙里算力的重要基建。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。