OpenAI用GPT-4解读GPT-2，看来能打败魔法的，只有魔法

来源丨元宇宙简史

作者丨元宇宙简史编辑Eco

OpenAI最新研究利用GPT-4自动进行大语言模型中神经元行为的解释和评分，并将其应用于另一种语言模型GPT-2，公开了这些GPT-2神经元解释和分数的数据集。这项技术让人们能够利用GPT-4来定义和自动测量AI模型的可解释性，从而更好地理解智能是如何工作的。

大语言模型是基于大量文本数据训练，包含数千亿或更多参数的语言模型。

在大数据时代，这类AI机器学习模型可以在提升产品销售、辅助人类决策过程中起到很大的作用。

但是计算机通常不会解释它们的预测结果，而语言模型想要变得更强大、部署更广泛，就需要研究可解释性，因为人类对模型内部工作原理的理解仍然非常有限，例如可能很难从中检测到有偏见、性内容输出。

EigenLayer将增加LST上限，第三季度将上线Operator测试网:7月1日消息，以太坊再质押协议EigenLayer宣布将增加流动性质押代币（LST）的上限，不过相关协议参数更改还须获得多重签名治理系统的批准。EigenLayer操作多重签名通过时间锁执行例行升级和维护，对所有安全关键操作强制执行至少10天的延迟，这也意味着，7月10日之后Operations多签可以取消上限。EigenLayer预计将在7月10日当周提高LST上限。届时，LST上限（包括rETH、stETH和cbETH）将增加到15,000个代币（每类LST），没有个人存款限制。一旦所有LST存款的总和达到3万枚代币，将启动暂停LST再质押。

EigenLayer表示，随着LST上限的增加，将探索EigenLayer路线图的下一步。重点仍然是增强再质押体验，同时确保安全性和去中心化。具体计划是，第三季度上线Operator测试网，第四季度上线主动验证服务（AVS）测试网，预计2024年第一季度上线AVS主网。[2023/7/1 22:12:06]

可解释性就是将模型能用通俗易懂的语言进行表达，把模型的预测过程转化成具备逻辑关系的规则的能力，从而通过查看模型内部来发现更多信息。

0xScope：2022年初Alameda曾向Lido存入3.35万枚以太坊并将stETH存入Anchor:12月14日消息，据0xScope监测，2022年1月和2月，Alameda一地址曾向Lido存入3.35万枚以太坊并将获得的stETH存入Anchor Protocol作为抵押品，在FTX暴雷后，该地址连同至少24个Alameda其他地址将所有资产存入了一个多签钱包。该多钱钱包目前持有6812枚以太坊和价值约1.03亿美元的其他资产。0xScope猜测转移至多签钱包的举动或为监管要求。[2022/12/14 21:44:26]

例如，如果有一个针对“漫威超级英雄”的神经元，当用户向模型提问“哪个超级英雄的能力最强”时，这个神经元就会提高模型在回答中说出漫威英雄的概率。

Dolce&Gabbana、inBetweeners与UNXD在OpenSea上推出新的NFT Drip系列:金色财经报道，Dolce&Gabbana、inBetweeners与UNXD在OpenSea上独家推出新的NFT Drip系列。该系列由GianPiero D'Allesandro设计，包含2,000只数字熊。每只熊都穿着21款独特的 Dolce&Gabbana产品中的一款。更重要的是，持有者将获得与他们的NFT相匹配的独家 Dolce&Gabbana服装和收藏品的实物印刷品。?[2022/12/10 21:35:07]

站在OpenAI的角度看，大模型未来将和人脑一样拥有“神经元”，这些神经元会观察文本中的特定规律，进而影响到模型本身生产的文本。

所以可解释性就是将模型能用通俗易懂的语言进行表达，把模型的预测过程转化成具备逻辑关系的规则的能力，从而通过查看模型内部来发现更多信息。

为了实现这个目标，OpenAI最近发布了一个关于GPT-4语言模型解析神经元的对齐性研究成果，利用自研基于GPT-4技术的开源工具，来尝试计算其他架构、更简单语言模型上神经元的行为并对其进行评分。

OpenOcean正式聚合去中心化跨链交易协议MDEX:据官方消息，全聚合协议OpenOcean.Finance已于2021年4月20日 16:30（UTC+8）正式聚合去中心化跨链交易协议MDEX交易，为用户提供一站式交易入口，用户可以在OpenOcean上进行Swap交易时，链接MDEX生态桥梁。详情点击原文链接。[2021/4/20 20:40:47]

而且，还可以将其应用于另一种语言模型中的神经元——本次选择4年前发布、包含307200个神经元的大模型GPT-2为实验样本，公开了这些GPT-2神经元解释和分数的数据集。

动态 | Open Node拒绝Roger Ver捐款:加密初创公司Open Node发布推特拒绝此前Roger Ver捐款，并称：“只有通过比特币，我们才能实现更好、更开放的金融体系。”此前，有网友称。Roger Ver为Open Node捐赠100万美元，要求其放弃BTC，而选择BCH作为支付选项。[2018/12/30]

“我们迈出了使用AI进行自动化对齐研究的重要一步。”OpenAI联合创始人GregBrockman表示。

具体来说，OpenAI开发了一套包含自动化工具和测试方法的评估流程：

首先，研究人员让GPT-2运行文本序列，等待某个特定神经元被频繁“激活”；

然后，让GPT-4针对一段文本生成解释，例如通过GPT-4接收到文本和激活情况判断漫威是否与电影、角色和娱乐有关；

随后用GPT-4模拟GPT-2的神经元接下来会做什么，预测行为；

最后评估打分，对比GPT-4模拟神经元和GPT-2真实神经元的结果的准确度，在下图这个例子中，GPT-4的得分为0.34。

使用上述评分方法，OpenAI开始衡量他们的技术对网络不同部分的效果，并尝试针对目前解释不清楚的部分改进技术。例如，他们发现以下方式有助于提高分数：

-迭代解释。他们可以通过让GPT-4想出可能的反例，在根据其激活情况修改解释来提高分数；

-使用更大的模型来进行解释。随着解释模型能力的提升，平均得分也会上升。然而，即使是GPT-4给出的解释也比人类差，这表明还有改进的余地；

-改变被解释模型的架构。用不同的激活函数训练模型提高了解释分数。

OpenAI表示，他们正在将GPT-4编写的对GPT-2中的所有307,200个神经元的解释的数据集和可视化工具开源，同时还提供了OpenAIAPI公开可用的模型进行解释和评分的代码，从而希望学术界能开发出新的技术来提升GPT模型解释分数。

OpenAI还发现，有超过1000个神经元的解释得分至少为0.8分，这意味着GPT-4模型可以解释大部分人类神经元，同时目前GPT理解的概念似乎和人类不太一样。例如，他们发现了一些有趣但GPT-4并不理解的神经元。

这些神经元似乎对文本中的某些特征或模式有敏感度，但是GPT-4无法用简单的语言描述它们。OpenAI希望随着技术和研究方法的改进，进一步提高AI模型可解释性能力，从而更好地理解这些神经元的行为和意义。

对于本研究局限性，OpenAI表示，目前GPT-4生成的解释还不完美，尤其要解释比GPT-2更大的模型时，表现效果很差。

神经元复杂行为无法用简短的自然语言描述，OpenAI解释了神经元的这种行为，却没有试图解释产生这种行为的机制，而且整个过程算力消耗极大等。

OpenAI希望在未来的工作中可以解决上述这些问题，最终OpenAI希望使用模型来形成、测试和迭代完全一般的假设，从而比肩人类大脑的想法和行为，以及将其大模型解释为一种在部署前后检测对齐和安全问题的方法。

然而在这之前，OpenAI还有很长的路要走。

“我们希望这将开辟一条有前途的途径。”JeffWu表示，这一技术可以让其他人可以在此基础上构建并做出贡献的自动化方案，从而解决AI模型可解释性问题，很好地解释这些模型行为，比如AI如何影响人类大脑中的神经元等。

严正声明：本文为元宇宙简史原创，未经授权禁止转载！内容仅供参考交流，不构成任何投资建议。任何读者若据此进行投资决策，风险自担。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

中币下载NFT资产浏览器NFTSCAN发布公测版

1900/1/1 0:00:00

巴比特讯,7月22日,NFT资产浏览器NFTSCAN发推宣布发布公开测试版。据悉,NFTSCAN是基于以太坊网络的NFT资产浏览器产品,测试阶段已收录40个热门NFT项目,例如OpenSea、Rarible、CryptoPunks、M.

狗狗币Loot终极指南，看这一篇就够了！

1900/1/1 0:00:00

来源：DappRadar作者：HristinaYordanova 编译：小回什么是Loot及其衍生品LootforAdventurers发布还不到一周,已经在NFT社区中引起了巨大轰动.

ADA易被忽视的Web3增长困境：增长平台自身是否也在增长？

1900/1/1 0:00:00

作者：Web3Traveler在挑选任务平台时,项目方不仅需要考量平台带来的流量,更需要思考：平台是否在实现自身增长。“工欲善其事,必先利其器。智者当借力而行”。在Web3行业中,选对工具对项目发展如虎添翼.

BNB价格热潮退去，元宇宙营销是否还能幸存？

1900/1/1 0:00:00

图片来源：由无界AI工具生成来源：VR陀螺作者：ZJ 一场突如其来的风暴让一些行业观察家开始怀疑,曾经在营销界最受欢迎的元宇宙,是否还能维持生命。像ChatGPT这样的生成型AI已经占据了技术炒作周期,吸引了人们的全部目光.

银河链

OpenAI用GPT-4解读GPT-2，看来能打败魔法的，只有魔法

银河链