阶段式同步重构自Go-Ethereum的完全同步模式,以实现更好的性能。
阶段式同步需要进行大量读写操作。虽然我们的目标是能够在机械硬盘上同步节点,但是我们仍建议使用固态硬盘。
顾名思义,阶段式同步需要依次执行10个阶段。
阶段式同步是如何运作的
Turbo-Geth客户端会向每个对等节点了解该节点的HEAD区块,然后依次执行每个阶段、寻找本地HEAD区块和对等节点的HEAD区块之间缺失的区块。
第一个阶段会设置本地HEAD区块。
各阶段会按顺序执行。在每个阶段执行期间,只有节点本地的状态达到目标状态,该阶段才会结束。
也就是说,在理想情况下,每个阶段只需执行一次,即可完成初始同步。
最后一阶段结束后,整个同步流程会重新开始,寻找新的区块头下载。
以太坊Layer 2总锁仓量为84.8亿美元,7日涨幅2.04%:金色财经报道,据L2BEAT数据显示,以太坊Layer 2总锁仓量为84.8亿美元,7日涨幅2.04%。锁仓量前三分别是Arbitrum One、Optimism和zkSync Era。[2023/6/18 21:44:26]
如果你在两个阶段之间重启应用,应用会从第一阶段开始重启。
如果你在某个阶段执行期间重启应用,应用会从当前阶段开始重启,以完成该阶段。
每个阶段需要耗时多久?
通过下方的饼状图,我们可以看出每个阶段的耗时占比。虽然这些数据并不精确,但是足以作为参考。
重组/回退
如果区块链发生重组,我们需要“回退”部分同步数据。
回退指的是从最后一个阶段倒退回第一个阶段。但是,需要注意的一点是,我们执行完回退之后才会更新交易池,因此我们知道新的nonce。
数据:以太坊网络当前已销毁228.92万枚ETH:金色财经报道,据Ultrasound数据显示,截止目前,以太坊网络总共销毁2,289,225.38枚ETH。其中,OpenSea销毁230047.52枚ETH,ETHtransfers销毁212332.10枚ETH,UniswapV2销毁131946.92枚。注:自以太坊伦敦升级引入EIP-1559后,以太坊网络会根据交易需求和区块大小动态调整每笔交易的BaseFee,而这部分的费用将直接燃烧销毁。[2022/5/10 3:02:14]
回退的阶段顺序如下例所示。
state.unwindOrder=*Stage{
??//Unwindingoftxpool(reinjectingtransactionsintothepoolneedstohappenafterunwindingexecution)
高盛CEO所罗门:本人并不持有比特币和以太坊:12月7日消息,高盛CEO所罗门称,希望客户在加密货币中做他们想做的事情,本人并不持有比特币和以太坊。(新浪财经)[2021/12/7 12:57:27]
??stages,stages,stages,stages,stages,stages,stages,stages,stages,stages,
?}
通过?ETL?进行预处理
在将数据插入数据库之前,一些阶段会使用我们的ETL框架根据键值对数据进行排序。
这样就可以极大减少数据库写入放大的情况。
因此,当我们生成索引或者说哈希值化状态时,我们会执行一个多步骤流程。
将处理过的数据写入位于数据目录的几个临时文件中;
然后使用一个堆栈把临时文件中的数据插入到数据库中,并且使按照能够最小化数据库写入放大现象的顺序插入数据。
以太坊基金会更新支持的研发项目,涉及零知识证明的项目数量最多:4月27日消息,以太坊基金会公开了正在支持的研发团队的项目和领域,其中涉及“应用零知识证明”的团队和技术最多,近14个项目。
除了零知识证明之外,以太坊基金会还支持了关于ETH2研究、以太坊基金会官网、Ewasm、形式化验证、Geth客户端、Javascript团队、Remix、无状态客户端、Solidity等领域。[2021/4/27 21:03:39]
这种优化有时会将写入速度提高几个数量级。
各阶段
每个阶段都包含两个函数,分别是向前推进阶段的ExecFunc?和向后回退阶段的?UnwindFunc。
从理论上来说,部分阶段可以离线工作,但是当前版本并未实现这一功能。
阶段1:下载区块头
在这一阶段,我们会下载本地HEAD区块和对等节点的HEAD区块之间的所有区块头。
动态 | Circle向以太坊网络新增发1600万枚USDC:DAppTotal.com稳定币专题页面数据显示:10月11日06时17分 ,USDC发行方Circle向以太坊网络新增发1笔价值1,600万美元的USDC, 块高度为:8716619,交易哈希值为:0xe93d1d4505a2d2ff908063e88a270769d5969b5f50a924382f41064ce813163f 。截至目前,Circle在以太坊网络上的ERC20 USDC总发行量已达470,026,465枚。请广大投资者警惕行情变动,谨慎应对市场风险。[2019/10/11]
这一阶段是CPU密集型的,适合使用多核处理器,因为要验证区块头的工作量证明。
由于区块链重组,大多数回退都是在这一阶段开始的。
这一阶段会推动本地HEAD的指针。
阶段2:区块哈希值
从区块头中抽取出一个从区块哈希值映射成区块号的索引表,以支持更快速的查找功能,并让同步过程对机械硬盘更为友好。
阶段3:下载区块体
在这一阶段,我们会将上一阶段已下载区块头的区块体也下载下来。
这一阶段需要保持良好的联网连接。绝大多数数据都在这一阶段下载。
阶段4:复原发送者
这一阶段会复原出并存储每个已下载区块中的每笔交易的发送者。
这一阶段同样是CPU密集型的,适合使用多核处理器。
这一阶段不需要联网。
阶段5:执行区块
在这一阶段,我们会执行之前下载的所有区块中的每一笔交易。
需要注意的一点是,在执行区块的过程中,我们不会验证根哈希,甚至不会创建默克尔树。
这一阶段是单线程的,无需联网,需占用大量磁盘空间。如果区块执行失败,可以回退该阶段。
阶段6:计算状态根
这一阶段会构建默克尔树,并验证当前状态的根哈希。
这一阶段也会构建中间哈希值,并将它们存储到数据库中。
如果之前没有存储任何中间哈希值,这一阶段会构建出完整的默克尔树及其根哈希。
如果数据库中没有中间哈希值,这一阶段就会利用区块的历史记录来弄清楚哪些哈希值已经过时,哪些哈希值是最新的,然后使用最新的哈希值来构建部分默克尔树,只重构过时的哈希值。
如果根哈希无法匹配,就会向后回退一个区块。
这一阶段不需要联网。
阶段7:生成哈希值化状态
在执行期间,Turbo-Geth使用无格式状态存储。
无格式状态:在标准状态中,账户和存储项的地址是?keccak256(address)?,但是在一般状态中,二者的地址就是?address?。
尽管如此,为了确保一些API能够正常运作并与其它客户端保持兼容,我们也会生成哈希值化状态。
如果哈希值化状态不是空值,我们会查看历史记录变更集,并且只更新已更改的项。
这个阶段不需要联网。
阶段8、9、10?:生成索引
同步期间会生成3个索引。
这3个索引可能会被禁用,因为所有API都不使用它们。
这一阶段不需要联网。
交易查询索引
该索引表由从交易哈希值到区块号的映射构成。
账户历史索引
该索引存储了从账户地址到区块列表的映射。
存储历史索引
该索引存储了从存储项地址到区块列表的映射。
阶段11:交易池
在这一阶段,我们会启动交易池或更新其状态。例如,如果我们已下载的区块中包含了某些交易,就把这些交易从交易池中移除。
在回退时,我们会将被回退的区块中的交易重新添加到交易池中。
这个阶段不需要联网。
原文链接:
https://github.com/ledgerwatch/turbo-geth/tree/master/eth/stagedsync
作者:?AlexSharov
翻译&校对:闵敏?&?阿剑
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。