作者:楼嵩来自致力于「构建区块链互联网络,打通价值孤岛」的BitXHub团队
研究方向:Web3+
导读
别以为这是一个诱饵式标题,这篇文章是一篇干货文章,因此取这个标题是有深层次的技术原因的。
本标题的句式是一个疑问句,仔细看,其实包含2个问题:
1.在数字时代如何成为一个有身份的人?
第一个问题答案是「普通的数字身份」。在看文章的各位其实都有一个数字身份,要么是微信号,要么是IP地址。
但你是否发现一个问题:这些数字身份并不是你真正拥有的,而是身份提供商分发给你的。IP地址是运营商分发给你的,随时可以被运营商收走。微信号也是腾讯分发给你的,你知道账户密码,但是服务器更加知道。你选择信任运营商信任服务提供商,信任他们不会随意破坏你的身份,但这没有技术保障。
2.如何真正拥有身份?
是否有可能真正把账户掌握在自己手里?
是否有可能登录账户,但不告诉服务器你的密码是多少,却还是能够让服务器验证你确实知道密码,同时其他任何人都无法冒充?
答案是有。
本文将会进行介绍相关技术以及基于这些技术构建的Web3时代的数字身份技术:分布式数字身份。
首先我们来回顾一下身份发展的历程。
身份发展的趋势
在中国古代,身份最早出现在秦朝,当时商鞅变法,避免外国间谍的入侵,发明了照身帖。
之后身份技术在古代不断发展,我们常在电视剧中看到过的虎符、免死金牌、玉玺、锦衣卫的牙牌,都是古代用于证明身份的技术。
图1-1
到了现代,我国第一代身份证于1984年发布,此后不断改进,不断加入防伪技术。2004年发布了第二代身份证,并且加入了多重防伪技术。2013年,融合了居民的生物特征。
我们发现,身份发展有两大的趋势:防伪和互通。
防伪这个趋势很好解释,身份本来就是为了证明“我是我”,防伪降低了“其他人冒充我”和“我冒充其他人”的概率。
而互通的原因是,人们往往同时拥有多个特征及身份,指纹特征、面容特征,既有居民证明又有驾驶证明。
近7天有31916.32枚BTC流出交易所钱包:金色财经报道,数据显示,近24小时有136.84枚BTC流出交易所钱包,近7天有31916.32枚BTC流出交易所钱包,近30天有12923.7枚BTC流出交易所钱包。截至发稿时,交易所钱包余额合计为1,877,943.83枚BTC。[2023/5/15 15:02:31]
现代的数字身份也有类似的趋势。
随着信息技术的发展,数字身份开始出现,并先后涌现了中心化身份、联盟身份、用户为中心的身份、自主权身份这四个阶段的身份。
这四个阶段的发展的趋势有3个:去中心化、互通、隐私保护。
去中心化:用户个人对自己身份的完全掌控,只有自己知道密码,只有自己有权限修改、读取身份信息,身份权无法被任何其他机构剥夺。去中心化可以被理解为是一种终极意义上的防伪。防伪防到从技术上实现只有“我才能证明是我”。
互通:注册一次数字身份,可以在其他服务商的任意数字服务上登录。
隐私保护:用户自己保管数据,从而能够决定数字服务能够调用哪些数据。
数字身份的发展趋势比身份的发展趋势多了一个隐私保护。
因为数字身份比较涉及到数据,而数据、隐私这个话题是目前非常热门的一个话题。2020年10月21日,全国人大法工委就《个人信息保护法》公开征求意见,意味着我国首部专门保护个人信息的法律不远了。
分布式数字身份属于第四个阶段,其希望最终能够提供实现自主权身份SSI的全部技术。有机构预测分布式数字身份的市场会在2017-2025年增长127倍,从5760万美元达到73亿美元,由此可见分布式数字身份的发展前途无量。
接下去介绍下分布式数字身份涉及的技术。
非对称加密与数字签名
前面提到过“不告诉服务器你的密码是多少,却还是能够让服务器验证你确实知道密码”的技术是存在的,这种技术被称为零知识密码证明,IEEEP1363.2定义了这种技术。
如果为零知识密码证明进行分类,它属于非对称加密的一种,而且IEEE认为它也是零知识证明的一种。
限于篇幅和行文目的,我们这里只简单介绍下非对称加密,而不介绍零知识密码证明的细节,二者原理是相通的。
非对称加密是现代密码学中非常重要的一个分支。一般的非对称加密中用于认证用户的不是密码,而是密钥,可以理解为了一个长度很长的密码。
密码学主要是用于信息加密的,加密前的内容称为明文,比如“ATTACKAT6AM”,使用某个加密密钥以及加密算法后,加密后可能变成了“NP7-UB-LDBUUB”,这个叫做密文。
BitKeep:将上线赔付申请页面,目前正在紧急开发中:1月3日消息,对于2022年12月份发生的黑客攻击事件,Web3多链钱包BitKeep在电报群公告中发布赔付方案,将上线一个赔付申请页面,本次事件的受损用户可通过该页面提交赔付地址、币种等信息,目前正在紧急开发中。待页面上线之后,将第一时间同步到社群中。
此前12月26日消息,BitKeep钱包因APK版本劫持而被盗,被盗资金价值已达800万美元。12月29日消息,BitKeep称将全额赔付受损用户,已启动报警和立案程序。[2023/1/3 22:23:21]
要想从密文得到明文,必须使用解密密钥以及解密算法。如果加密密钥和解密密钥相同,则为对称加密;如果不同,则为非对称加密。
非对称加密的密钥有一对2把,称为公钥和私钥。
公钥加密的内容,用私钥可以解密;反之用私钥加密的内容,公钥可以解密。一般私钥私藏,只有用户自己知道;公钥需要公布给其他人。这样别人想要给用户发送消息时,使用公钥加密该消息,加密后的消息只有拥有用户私钥的自己才能解密,其他拥有公钥的人无法解密。
非对称加密主要是用于信息加密的,那如何用于用户的认证呢?
数字签名。
假设用户A要证明自己是A,首先,构造一条消息“IAMA”;然后对该消息哈希函数运算得到哈希值H(IAMA),然后使用私钥Priv对该哈希值进行加密,所得到的密文E(H(IAMA),Priv)即为用户A对消息“IAMA”的数字签名。
将消息原文“IAMA”和签名E(H(IAMA),Priv)发给其他人,其他人使用用户的公钥可以解密签名得到H(IAMA);然后也对消息原文进行哈希计算得到H(IAMA)’,如果H(IAMA)’==H(IAMA),说明发送“IAMA”消息的用户的确拥有私钥Priv,证明他就是用户A。
总而言之,私钥其实就相当于是用户的密码,而公钥可以给服务器用来验证用户是否真的持有私钥,验证的方式就是验证数字签名。
有了这个基础,接下去就可以介绍分布式数字身份DID了。
分布式数字身份体系是基于非对称加密和数字签名建立起来的。
DID规范
分布式数字身份DID发展至今主要有5个技术规范:DID标识符、DID文档、DID解析器、可验证声明、身份存储库,这些技术规范的主要领导组织是W3C和DIF。
之所以有这几个规范,其实也和身份系统本身的需求有关:
DID标识符:身份标识符的格式;
DID文档:身份信息的格式;
法甲俱乐部发起Web3联盟,将打造包括粉丝代币、nft等在内的Web3产品:11月21日消息,据外媒报道,法国足球甲级联赛(Ligue1)俱乐部宣布共同发起发起Web3联盟“The League of France Football Club”,目前顶级俱乐部图卢兹等已加入,该联盟将打造多个Web3产品,比如粉丝Token、NFT、上线足球赛事、并且为法甲联赛内的各家俱乐部发行NFT权益卡。(bignewsnetwork.com)[2022/11/21 7:51:54]
DID解析器:身份信息的获取,为身份认证提供了保障;
可验证声明:隐私数据披露的方式,为数据授权提供了保障;
身份存储库:隐私数据的管理;
▲DID标识符
根据Zcash创始人提出的标识符系统“Zooko三角理论”,标识符无法同时实现实现安全、去中心化、对人类有意义三者,W3CDID标识符主要考虑了安全、去中心化两者。
此处的ALPHA和DIGIT的在ABNF中有定义,而未在此ABNF中定义的其他语法在RFC3986中有定义,值得一提的是W3CDID标识符是符合W3CURI的规范的。
举个例子:
did:ethr:0xE6Fe788d8ca214A080b0f6aC7F48480b2AEfa9a6
即为一个DID标识,其中ethr是method-name,指明了身份所在的域;0xE6Fe788d8ca214A080b0f6aC7F48480b2AEfa9a6是method-specific-id,表明了这个身份在域中的地址。
▲DID文档
DID标识符只是表示一个身份的标识符,不包含身份的信息。而DID文档就是用于描述身份详细信息的文档,一个DID标识符关联到一个DID文档。
DID文档一般包含以下内容:
DID标识符;
一个加密材料的集合,比如公钥;
验证方法集合;
一个服务端点的集合;
时间,包括创建时间和更新时间。
DID文档的示例:
Nomad:已有86个白帽地址返还价值3200万美元的资产:8月6日消息,跨链互操作性协议Nomad发推表示,迄今为止,已有86个钱包地址向Nomad恢复钱包返还价值3200万美元的资产。希望白帽继续返还资金至0x94a84433101a10aeda762968f6995c574d1bf154地址(ETH/ERC-20)。
昨日Nomad表示将为归还至少90%所盗资金的攻击者提供最高10%的奖励。此前据欧科云链OKLink分析报告显示,Nomad Bridge攻击事件共涉及1251个ETH地址、14个币种,涉案金额约1.9亿美元。[2022/8/6 12:06:23]
其中/img/20230515214937544159/3.jpg "/>
Ripple开发部门RippleX开展原生NFT功能测试:7月6日消息,根据Ripple开发部门RippleX发布的最新消息,其开发团队现在对XRP Ledger支持NFT XLS-20标准的能力充满信心。
此前,Ripple升级了服务,以便让验证者投票支持实施上述标准。开发团队开始测试XRPL是否能够支持NFT带来的额外交易负载。当进行XRP支付时,RippleX团队能够达到每秒2199笔交易的峰值持续吞吐量。
开发团队还通过创建100万个账户(每个账户铸造20个NFT)来测试NFT的吞吐量。在此之后,RippleX还衡量了XRP的支付情况、NFT交易以及铸造情况。
需要注意的是,这些测试是在理想的环境中进行的,具有合成的工作负载。这意味着上述数字并不能反映该网络的真实表现,因为在一个站点中只有5个验证器运作。相比之下,实时的网络有数百个节点在全球各地运行。(U.Today)[2022/7/6 1:54:35]
图3-1
▲可验证声明
接下去介绍DID的第四个技术规范可验证声明,其可能是目前DID生态里最重要的规范。可验证声明VerifiableCredential,简称VC。
VC的目的前面说过,就是数据授权,而且是尽可能细粒度的授权,从而尽量降低隐私数据的泄露。
图3-2
对某个东西的证明可以通过披露不同程度的隐私来实现,如图3-2从左到右,隐私泄露程度降低。来看一个例子。
假设你今年24岁,如何证明你大于21岁?如果有三种选择:
出示身份证
出示出生年月日
开一个大于21岁的证明
你会选择哪种?
很明显,这三种方案对你个人隐私的披露程度是不同的。
第一种对你隐私信息的泄露最大,而第二种其次,而第三种几乎没有泄露任何多余的信息。
图3-3
VC运行需要有一套机制,需要有很多角色。可以看到图3-3里有很多角色,这些角色的功能如下:
发行者:能开具VC,如政府、银行、大学等机构和组织。
验证者:能验证VC,由此可以提供给出示VC者某种类型的服务,如游戏网站、香烟店。
持有者:即用户,能向Issuer请求&接收、持有VC,向Verifier出示VC,开具的VC可以存放在钱包里,方便以后再次证明时使用。
标识符注册机构:维护DID标识符及密钥的数据库,如区块链、可信数据库、分布式账本等。
VC的数据格式是什么样的呢?其大致会包含以下字段:
VC的ID;
VC的发行者;
声明的主体内容;
声明的证明。
时间,如发行时间。
一个实例:
在这个VC中,@context字段指明了这个VC的格式;id字段指明了VC的id;type字段指明了VC的类型;issuer字段指明了VC的发行者;issuanceDate字段指明了发行日期;credentialSubject字段指明了VC的主体内容;proof字段指明了VC的证明部分,可以被Verfier验证。这里最重要的内容当然是credentialSubject和proof。▲身份存储库
接下去介绍DID的第五个技术规范,IdentityHub。
首先我们要明确身份数据和隐私数据是不同的。身份数据是指公钥这种只和这个账户相关的数据,而隐私数据是和用户自己真实信息相关的数据如性别年龄等。
DID文档里只存储和身份相关的数据;而IdentityHub就是用来存储用户的隐私数据的。IdentityHub,虽然是身份的Hub,但是存储的是数据,可以理解为数据银行。
我们习惯将资产放到银行,为什么?因为安全,银行保证了我们资产的安全。同样地,未来我们将数据存储到数据银行,可以保证数据的安全。
其有如下几个特点:
IdentityHub是去中心化的、链下的个人数据存储,可将对个人数据的控制权交给用户。它们允许用户以安全而隐私的方式存储其敏感数据,无用户的显式授权就无法获取用户数据。
IdentityHub实际在哪由用户决定,可以是本地,也可以是云端;
在未来,用户将会把隐私数据存储到IdentityHub,然后当应用服务调用用户数据时必须请求用户的同意才能获取这些数据。
一个简例
来看一个简例。将上面的内容都串起来。
假设小明有一个以太坊上的账户0x96f…3d4,小明想使用DID来登录支持DID的游戏网站A。
1.小明找一个DIDRegistry服务帮其在以太坊上注册一个DID:did:eth:0x96f…3d4;
2.DIDRegistry服务将与该DID相关的DID文档存储到以太坊链上;
3.小明在游戏网站A上使用注册的DID登录;
4.小明将其个人隐私数据存储在多个身份存储库,其中居民身份证上的隐私数据存在政府机构G,政府机构G也需要注册好自己的DID身份的;
5.在游戏网站A上,小明想证明自己年龄>16岁从而获得游戏时间;
6.小明向政府机构G请求开具一个自己年龄>16岁的可验证声明;
7.政府机构G通过查询小明的居民相关隐私数据发现小明确实>16岁,因此开出了这个VC给小明;
8.游戏网站A验证这个VC的签名,发现确实是政府机构G开具的选择信任,从而发放游戏时间;
9.假如某一天,游戏网站A倒闭了。此时小明的DID依旧存在,还可以用于其他应用的登录。
总结
总结一下DID。
DID的提出是为了达到自主权身份。但是实际上是否能够完成其目的呢?
从身份上看确实DID的方案是不错的,将身份存储在区块链上,用非对称加密的密钥保证用户对账户的完全控制。这部分确实DID做的不错。
不过我们也很明显能发现一些问题,主要是在数据存储上。
在VC系统里发放VC的Issuer其实还是掌握用户数据的,因此VC的这个运转架构本质上还是中心化和可控的,用户必须要相信某些机构来托管隐私数据。但这已经比把这些隐私数据放在服务提供商的服务器上要好太多。
而服务提供商虽然没办法拿到用户的隐私数据,但是用户在服务提供商处产生的数据,比如小明玩游戏产生的装备、皮肤、等级,这些数据似乎还是被游戏网站A牢牢掌控住了。
课后习题
1.根据本文内容,以下关于“分布式数字身份”的描述,是错误的?
分布式数字身份基于非对称加密和数字签名技术
分布式数字身份属于数字身份发展的第三阶段
分布式数字身份是为了实现自主权身份
分布式数字身份可以实现个人真正拥有数字身份
2.以下哪个字符串不符合W3CDID标识符的格式?
did:btc:21tDAKCERh95uGgKbJNHYp
did:btcr:xz35-jznz-q9yu-ply
did:github:gjgd
都符合
3.以下说法正确的是?
一个DID文档必须包含服务端点相关的信息
非对称加密中使用公钥加密的信息无法用私钥解密
对某个消息进行数字签名过程是:先对该消息进哈希,然后使用私钥进行加密
我国第一代身份证于1994年发布
4.DID解析器收到did:abc:0x01的解析请求后,以下说法错误的是?
会调用abcDriver进行解析
所调用的Driver一定是在区块链上进行查询
Driver返回一个DID文档
DID文档可以是JSON、JSON-LD等格式
5.以下说法不正确的是?
可验证声明可以最低程度披露用户的隐私
可验证声明的proof可以被Verifier用于验证此声明的有效性
身份存储库主要是存储用户的隐私数据
身份存储库必须是运行在云上
答案都藏在文章里哦
本文用图来源
图1-1:https://kknews.cc/zh-hk/history/y5jeaon.html
图3-1:https://medium.com/decentralized-identity/a-universal-resolver-for-self-sovereign-identifiers-48e6b4a5cc3c
图3-2:https://uniqueid.substack.com/p/verifiable-credentials-your-digital
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。