急速7小时 | Filecoin官方复盘网络短时中断事件

编译:华科闪云

原文链接:https://filecoin.io/blog/resolving-the-chain-halt/

Filecoin官方发布博客,复盘2020年12月19日Filecoin网络短时中断事件,宣传当前多个团队已经开始事后分析的编写和执行,以确定actors/lotus的测试覆盖范围,以及网络基础设施、通信警报等其他改进,以降低问题再次发生的可能性。

2020年12月19日,Filecoin网络经历了链上中断,这意味着可以在一段时间内创建新的区块,但矿工无法就产生的状态达成共识,每个成员计算出不同的价值。

Osmosis已通过关于Thridening的两项提案:7月11日消息,基于Cosmos的去中心化交易所Osmosis已通过关于Thridening的两项提案,其中551提案提议燃烧6月20日Thirdening事件延迟期间产生的约54万枚多余的OSMO,将最大发行量恢复至10亿枚;552提案提议将Thirdening效果恢复为1/3缩减、将间隔时间延长至两年。[2023/7/11 10:47:26]

由于社区成员,矿工和开发人员之间的快速响应,修复程序在四个小时内发布,并且网络在七个小时内实现了完全恢复。

原因

FatMan:在UST贬值前的3周内,Terraform Labs抛售了超过4.5亿美元的UST:金色财经报道,加密货币和金融研究员FatMan在社交媒体上表示,新的区块链数据揭示了5月UST贬值的根本原因。在贬值前的3周内,一个实体在公开市场上抛售了超过4.5亿美元的UST。在他们最后一次出售的4天后,UST开始崩溃。那个实体不是别人,正是Terraform Labs。[2022/12/7 21:27:19]

潜在的问题是对存储矿工参与者实现中的对象映射进行潜在的不确定性迭代。角色在Go中实现。众所周知,遍历Go映射是不确定的,参与者使用一种模式来始终在使用迭代之前对迭代结果进行排序。

加密市场制造商GSR宣布裁员近10%:金色财经报道,加密市场制造商GSR宣布该公司在第三季度将裁员\"作为结构改革的一部分\"。发言人表示,GSR裁减了”不到10%”的员工,GSR的网站拥有全球300名员工。经过一段时间的快速扩张,我们的重点是提高整体效率,继续发展我们的技术和交易能力。[2022/10/12 10:31:41]

不幸的是,在对两个这样的地图进行排序时使用的比较函数中的错误导致排序无效。因此,不同的节点以不同的顺序处理地图条目,从而导致不同的结果和Gas消耗。

该代码路径实际上只有通过一个矿工声明多个扇区立即终止,或一个矿工立即恢复跨越多个分区的故障,才能到达。。在此之前,主网中都没有使用这两种路径,没有将多个扇区/分区作为暴露非确定性的数据。多个部门的同时终止引发了这一停顿。

乌克兰的新筹款平台支持100多种加密货币:金色财经报道,乌克兰总统VolodymyrZelenskyy推出了一个名为United24的新筹款平台,该平台接受超过100种不同加密资产的捐款。支持的加密资产列表范围从流行的加密货币,如比特币(BTC)、以太坊(ETH)、币安币(BNB),到最近推出的apecoin(APE)和一些较小的去中心化金融(DeFi)硬币,如HectorFinance的HEC、StreamCoin的STRM和Enzyme的MLN。(cryptonews)[2022/5/10 3:02:40]

Filecoin参与者的测试涵盖了所讨论的代码,但不包括验证不同测试运行之间确定性执行的机制。Lotus节点实现的集成测试未涵盖终止多个扇区。

中断影响

最重要的是,应该强调的是,在中断期间没有丢失任何数据。虽然无法创建新的数据块暂时抑制了网络上的交易,但存储供应商提供的所有数据都是安全的,并且一旦网络恢复运行就可以使用。

此外,重要的是要注意,即使在链中断的情况下,Filecoin协议的规范也提供了数据检索。因此,尽管在事件持续时间内不可能进行链上交易,但Filecoin网络的核心功能仍保持不变。

此外,已采取的修复措施确保采矿作业本身不会因停机而受到处罚;取而代之的是,为了降低优先级并鼓励网络恢复,暂时降低了共识削减。

快速反应

首次发现,识别,修复和部署基本问题的速度也很明显:

事件发生后十五分钟内,自动监控触发了警报

在三十分钟内,矿工和实施开发人员聚集在一起

在四个小时内,开发人员确定并发布了此问题的修复程序

在七个小时之内,足够多的节点采用了此修复程序,以超过多数共识的功率阈值,使网络处于恢复的道路上

对于年轻的分散网络而言,这是一个令人难以置信的快速响应。即使建立blockchains经历链暂停和叉不时和Filecoin的时间为这个事件的解决是相当的给那个已经运行链的几年。整个社区应该为处理此事件的速度感到自豪。只有在世界各地多个团体的共同努力下才能实现这种恢复。

整个生态系统中的各方进行了协作以实现这一目标:矿工检测并报告了该问题,并引起了开发人员的注意;工程团队进行协调,以针对潜在问题开发并发布经过同行评审的补丁程序,同时通过社区渠道传达此修复程序的状态;全球各地的网络参与者都在努力应用补丁程序,并使网络尽快恢复在线。虽然不希望如此紧急的事件重复发生,但这是Filecoin生态系统内参与度和专注度的令人印象深刻的展示。

建立区块链就像建立软件火箭,它们是一项非常复杂的技术,因此很难在第一次尝试中就将所有事情都做好。就像真正的火箭一样,事情可能以意想不到的方式出错。当发生这种情况时,重要的是要有适当的基础架构以尽快解决问题,最大程度地减少影响并减少再次发生问题的可能性。

为了达到这个目的,多个团队进行了事后验收的编写和执行,确定了对参与者/角色的测试覆盖范围以及网络基础设施/通信的警报和问题升级的其他改进,以帮助减少未来的事件。

由于Filecoin社区的耐心,辛勤工作和投入,这种新颖技术的缺点不断得到解决。在发现并解决所有问题后,网络将进一步发展成一个稳定,可靠且经过飞行验证的平台。

来源:金色财经

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

银河链

LTC爱库存如何入驻?爱库存入驻有什么要求吗需求是什么呢

云货优选如何盈利? 云货优选是属于分享经济,分享经济在我们的身边其实挺多的平台在做的,但是很多的都是在凑人数,真正在做实事的其实没有几个,因为他们有一个等级制度卡着,云货优选的制度相对透明,大家都是在统一的起跑线上开跑.

[0:15ms0-1:567ms