“时间”是岁月更迭中的永恒话题。围绕时间的探讨一直在区块链以及其他分布式系统中进行。时间连接起进程与节点,我们也用时间的“粒度”来衡量连块成链的去中心化网络。
分布式系统中关于时间的难题在于,不同参与者的“物理时钟”很难达成完全一致。分布式系统大师Lamport提供了去中心化的方法,将问题转化为时间与顺序的联系,提出了逻辑时钟的概念,就像为包括区块链在内的分布式系统引入了“生物钟”。
stakefish编译Vac分析师、ENS开发者Dean Eigenmann的一篇文章,介绍Lamport关于时间、时钟和顺序的论述,为大家提示理解区块链和分布式系统时间另一个角度。
关于分布式系统的系列文章,用哪个话题开篇比较合适呢?以太坊的隐私交易协议AZTEC?以难以掌握著称的Paxos算法?这些话题还是留在以后写。今天,我选了一个基础话题作为开篇:分布式系统的时间话题。
A股开盘:深证区块链50指数上涨1%:金色财经消息,A股开盘,上证指数报3265.74点,开盘上涨0.24%,深证成指报11745.16点,开盘上涨0.37%,深证区块链50指数报3107.86点,开盘上涨1%。区块链板块开盘上涨1.24%,数字货币板块开盘上涨1.65%。[2023/2/28 12:33:08]
本文解读的是图灵奖得主、计算机大师Leslie Lamport的知名论文《分布式系统内的时间、时钟和事件顺序(Time, clocks, and the ordering of events in a distributed system)》。很久之后重读这篇文章并提炼关键概念,另有一番趣味。
不熟悉Leslie Lamport的朋友可以大概了解一下,他以创造LaTeX、TLA+、Paxos而闻名,还论述了拜占庭将军问题。当然还有Lamport时钟(第一个逻辑时钟),在本文中我们也将对其基本概念进行介绍。
先来看看分布式系统的定义。Lamport给出的定义是这样的:
动态 | 加拿大政府推迟区块链公司法规公布时间:据bitcoin magazine报道,加拿大政府已推迟发布针对加密货币和区块链公司最终法规的时间。最终法规本将于今年秋天公布,但加拿大政府表示,直到2019年底,才会在加拿大公报上公布新法案。由于加拿大联邦政府已进入2019年选举的选举前的模式,最终的加密货币法规已经被搁置。目前的监管制度将一直持续到2020年,这是因为新法案在公布后12个月后才会正式生效。[2018/8/29]
“如果一个系统内信息传递的延迟,与单一进程里的事件间隔的时间相比是不能忽略不计的,则称之为分布式系统。”
我喜欢这个定义,因为其专注在发出和收取消息之间的延迟上。
明确了定义,我们开始正式介绍。
为事件排序在本地再简单不过了。你只需在发生的时候为每一个事件赋予一个时间戳就好了。我们能够获得所有事件的总体顺序,也就意味着,所有事件都能够按照特定顺序排列。
但这个问题在分布式系统的情境下就困难多了。为什么呢?
一切皆因分布式系统的一个非常简单的性质:在节点之间传递的消息在发出之后,在未来的任何时间点都可能到达0次、1次或多次。这样的话,分布式系统的各个节点之间就不能就时间达成一致。举例来说:
行情 | 在美上市区块链概念股普跌:今日美股收盘,区块链中概股普跌。京东(JD)收跌1.21%,中网载线(CNET)收跌3.65%,拍拍贷(PPDF)收跌4.06%,网易(NTES)收跌1.8%,猎豹移动(CMCM)收涨1.04%,迅雷(XNET)收跌3.47%,寺库(SECO)收跌0.16%,人人网(RENN)收跌2.45%,第九城市(NCTY)收跌5.27%。[2018/7/19]
一个节点可以向另一个节点发送一条消息标注当前时间是12:00:00,但是接收者不知道消息用了多长时间传递,也就没办法确认到达时是否仍为12:00:00。如果这样,节点之间来来回回传一整天消息也无法确定信息是否同步。如果不能在时间上达成一致,我们也就不能在事件顺序上达成共识。
那怎么解决这个问题?
在分布式系统内,多个节点通过互相发送信息进行交流。节点收到信息首先确认这个信息,然后执行他的下一个事件。这样的顺序,本来就显示了一种“因果关系”:信息必须先被发出,才能被收到。
译注:这种因果关系是一种时序关系,不是逻辑上的原因和结果的关系。
那么根据因果关系就能得出顺序:发消息肯定在被他被接收之前。单看A、B两个事件,我们就能给出“发生在……之前(happens before)”的关系来描述顺序了。
广电总局局长:区块链等技术给广播电视领域带来前所未有的深刻变革:5月29日,国家新闻出版广电总局局长聂辰席到总局无线局基层台站实地调研。他表示,随着网络信息技术和互联网的迅猛发展,特别是大数据、云计算、人工智能等新一代信息技术的广泛应用,量子通信和区块链等新技术的迅速发展,给广播电视领域带来一场前所未有的深刻变革,也给广播电视传输覆盖事业带来严峻挑战。面临新形势新任务新挑战,要树立强烈的忧患意识、危机意识,直面问题、迎难而上,把握大势、抢抓机遇,着力推动广播电视传输覆盖事业转型升级,为新时代广播电视繁荣发展作出更大贡献。[2018/5/30]
现在,无需系统物理时间概念就可以识别这种关系:如果A对B造成了因果影响,事件A肯定发生在事件B之前。因果关系让我们确定系统中相关事件的顺序,是一种偏序(partial order)。
偏序也有一个局限性:如果不能确定相关性,我们可能不知道系统中每个事件的确切顺序。因为可能有许多事件会在整个系统内并发(concorrent),并非所有节点都知道这些事件的发生。
时钟
不过既然我们已经有了偏序,接下来把时钟添加到系统中,就能获取系统中的所有事件的总序(total order)。
金色财经现场报道 医链科技创始人贾求真:区块链技术重塑供应链金融征信体系:金色财经前方记者实时报道,第二届全球金融科技与区块链中国峰会于4月12日在上海召开,医链科技创始人贾求真在现场表示,在整个供应链金融发展阶段中,我们会提1.0、2.0、3.0,实际上供应链金融演进过程都与技术支撑的征信能力息息相关,这个是科技赋能金融的直接表现。传统征信是风控,这是传统金融模式1.0。大数据阶段的支持是数据金融,科技金融的阶段是要表达效率。而用区块链技术解决金融资产征信问题使得征信行业进入到3.0。[2018/4/12]
刚才我们已经知道了在分布式系统里使用物理时钟是不可行的,那么我们就需要使用逻辑时钟。逻辑时钟本质上是一个函数,能够给事件分配一个数字。这个数字表示事件发生的时间(从现在开始我们将把这个数字称为时间),与物理时间没有任何关系。
我们假设在这个分布式系统里的每个节点都有一个时钟。这个时钟随着在执行的事件间滴答行进,但时钟的行进并不被视为系统中的事件。对于系统中某个节点上发生的每个事件,逻辑时钟都会为该事件分配一个数字。根据这个假设,我们可以满足以下时钟条件:
?a,b a → b ? C(a) < C(b)
以上表达式代表什么意思呢?
箭头“→”表示“发生在……之前(happened before)”,而C代表时钟函数,可简单的理解为时间。所以要表达意思就是:对于每一个事件a,b,如果a发生在b之前,那么a的时间要小于b的时间。
但反推不成立,仅因为一个事件的时间比另一个事件的时间小,并不能说这个事件发生在前,他们可以是并发的。
在上面的图片中,我们可以看到节点α上,时间1和时间2各发生了1个事件;节点β在自己的时间1发生了1个事件。在节点α的时间1和时间2发生的事件,与在节点β的时间1发生的事件是并发的,没有因果联系。
如果a和b是单个节点上的两个事件,且a发生在b之前,则a的时间应该小于b的时间。
如果a是一个发送消息的节点,b是另一收到消息的节点,那么a的时间仍然应该小于b的时间。
节点需要在事件之间让时钟进行计时。如果不是,则必须将时钟调快到比从其他节点接收到的任何消息中包含的时间更晚的时间。b就可以在时钟调快之后发生了。
现在好啦,我们可以使用满足这些条件的时钟,建立整个分布式系统的总序啦,这里只是简单的根据各个事件的时钟给出的时间来排序。
用例
最后我们设置一个状态机来看看逻辑时钟的用法。比如我们有一个分布式系统,多个节点都想访问其中的共享资源,每次只能访问一个节点。状态机需要满足以下条件:
条件1:可以访问资源的节点必须先释放资源,然后其他节点才能访问他。
条件2:对资源的请求必须按照发出请求的顺序被授予访问权。
条件3:如果每个被授予访问权的节点最终都释放了资源,那么每个请求最终都会被授权。
为什么不引入一个中间协调者呢?因为这样的话,如果发生较早的请求却较晚到达,就不能满足条件2了;另一个原因是,我们希望采取去中心化的解决方案。
所以我们还是要构建条件,满足这个逻辑时钟。如何满足条件呢?
Lamport为我们提供了一个去中心化解决方案。首先,我们要让所有节点储存一个请求队列。其次,要满足一些简单的假设:
假设1:所有消息都按发送的顺序接收。
假设2:所有消息最终都被接收。
假设3:每个节点都可以直接向系统中的所有其他节点发送消息。
如果有更复杂的算法和协议,可以忽略以上假设。
现在我们可以定义满足这3个条件的算法,并在实践中展示时钟的功能:
1、如果一个节点想要请求一个资源,他会用当前时间创建一个请求,将他添加到他的队列中,并将他发送给其他每个节点。
2、所有其他节点将这个请求放入他们的队列中并发回响应消息。
3、释放资源的节点发送带有当前时间的释放消息,并从其队列中删除原来的请求。
4、当节点收到释放的消息时,他将从自己的队列中清除相关请求。
5、当一个节点在他的队列中有自己的排在任何其他请求之前请求时(按照时间总序),他可以自由地访问该资源,并且他在该时间之后从所有其他节点接收到消息。
上述算法是完全由各个节点独立执行的去中心化算法,他利用时钟来对请求按总序进行排序,从而实现对资源的访问和节点间的协调。
好啦,我们通过文章大概了解到如何使用这些逻辑时钟对分布式系统中的事件进行排序,并分析了分布式系统访问资源时确定顺序的实际应用问题。欢迎大家的意见反馈,我将继续更新更多关于分布式系统的文章。
原文标题:Time, clocks, and order
作者:Dean Eigenmann
编译:stakefish
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。