人类生成 or 机器生成?ChatGPT 引发了一场真假辩论

原文:英国《金融时报》

像ChatGPT这样的大型语言模型是合理性的提供者。许多聊天机器人基于所谓的生成式人工智能,经过训练可以通过在互联网上搜索相关信息并收集连贯的答案来回答用户的问题,从而生成令人信服的学生论文、权威的法律文件和可信的新闻报道。

但是,由于公开可用的数据包含错误信息和虚假信息,一些机器生成的文本可能不准确或不真实。这引发了人们争相开发工具来识别文本是由人还是机器起草的。科学也在努力适应这个新时代,现场讨论是否应该允许聊天机器人撰写科学论文,甚至产生新的假说。

区分人工智能和人类智能的重要性与日俱增。本月,瑞银分析师透露,ChatGPT是历史上增长最快的网络应用程序,1月份每月活跃用户达到1亿。一些部门已经决定没有必要锁住稳定的大门:周一,国际文凭组织表示,学生将被允许使用ChatGPT撰写论文,前提是他们注明引用了它。

中国人民大学杨东:区块链技术的成熟标志着人类社会走向数字文明:12月9日,在平安大讲堂活动上,中国人民大学区块链研究院执行院长、长江学者杨东表示,如果说人工智能、大数据技术是河流,区块链技术就是河床,没有河床的底层基础,就不会有河水的流动。区块链技术的成熟,使得真正的人工智能、大数据迈向一个智能化的时代,也标志着人类社会走向数字文明。同时,此次疫情加速了数字经济的发展。在后疫情时代,防止金融监管的“灯下黑”问题,有效加强金融监管,意义重大。对此,杨东提出,可通过构建科技驱动型监管,特别是以区块链技术为依托的“以链治链”,对金融领域进行全方位全过程监管;建立“共票”机制,发现数据价值、推动数据的联通共享;在当前环境下,还要给疫情中和疫情后处境困难的中小微企业提供创新的融资工具和金融环境。(每日经济新闻)[2020/12/9 14:41:43]

平心而论,这项技术的创造者坦率地指出了它的局限性。OpenAI首席执行官萨姆奥特曼(SamAltman)去年12月警告说,ChatGPT“在某些方面足够出色,足以给人一种伟大的误导印象”。我们在稳健性和真实性方面还有很多工作要做。”该公司正在为其内容输出开发加密水印,这是一种机器可读的秘密标点符号、拼写和词序序列;并且正在磨练一个“分类器”来区分合成文本和人工生成的文本,使用两者的例子来训练它。

动态 | 面向人类终身学习的公有链“产教云”正式发布:在教育部学校规划建设发展中心指导的第四届中国教育智库年会上,中国教育智库网总负责人/未来学校研究院执行院长郑德林表示:整个社会正在发生数字化的大迁徙,教育行业“数字孪生”时代即将到来,大规模在线协同已经变成可能,“组织”的边界将被打破,人类终身学习,离不开产业界和教育界共同的支撑,也离不开区块链的赋能。只有以区块链的思想和技术,才能将产业界蕴藏着的大量鲜活教育资源,发现-挖掘-最大限度数字化,提升教育行业的数字化水平,让学习更好地发生。

同步,在会上郑德林先生正式对外发布了“产教云”--支持人类终身学习的公有链。[2019/11/16]

斯坦福大学的研究生EricMitchell认为分类器需要大量的训练数据。他与同事一起提出了DetectGPT,这是一种发现差异的“零样本”方法,这意味着该方法不需要事先学习。相反,该方法会自行启动聊天机器人,以嗅探出自己的输出。

声音 | 工商银行原董事长:以区块链等为代表的信息技术深刻影响了人类的生产、生活及思维方式的变革:钱塘江论坛11月1日至3日在杭州举行。本次活动主题为《长三角一体化:金融、科技、产业的新使命》,钱塘江论坛主席、中国工商银行原董事长、世福资本董事长姜建清在2019届钱塘江论坛表示,当今世界正处在新一轮科技革命与产业变革孕育兴起时期,以大数据、互联网、物联网、人工智能、区块链等为代表的新一轮的信息技术不断突破,深刻影响了人类的生产、生活及思维方式的变革。新产业、新动能、新技术将成为影响经济增长的关键因素。(新浪财经)[2019/11/2]

它是这样工作的:DetectGPT询问聊天机器人它对示例文本的“喜欢”程度,“喜欢”是示例与其自己的创作有多相似的简写。DetectGPT然后更进一步——它“扰乱”了文本,稍微改变了措辞。假设是聊天机器人在“喜欢”更改后的人工生成文本方面比更改后的机器文本更具可变性。研究人员声称,在早期测试中,该方法在95%的时间内正确地区分了人类和机器作者。

需要注意的是:这些结果尚未经过同行评审;该方法虽然优于随机猜测,但在所有生成式AI模型中的工作可靠性并不相同。对合成文本进行人为调整可能会愚弄DetectGPT。

这一切对科学意味着什么?科学出版是研究的命脉,将想法、假设、论据和证据注入全球科学经典。一些人很快就将ChatGPT作为研究助理,一些有争议的论文将AI列为合著者。

Meta甚至推出了一款名为Galactica的科学专用文本生成器。三天后它被撤回了。在它被使用的这段时间,构建了一段熊在太空旅行的虚构历史。

Tübingen的马克斯普朗克智能系统研究所的迈克尔·布莱克教授当时在推特上表示,他对Galactica对有关他自己研究领域的多项询问的回答感到“困扰”,包括将虚假论文归咎于真正的研究人员。“在所有情况下,都是错误的或有偏见的,但听起来是正确和权威的。我认为这很危险。”

危险来自于看似合理的文本滑入真正的科学提交,用虚假引用充斥文献并永远歪曲经典。《科学》杂志现在完全禁止生成文本;《自然》杂志则允许使用它,前提是必须对使用进行了声明,但禁止将其列为共同作者。

话又说回来,大多数人不会查阅高端期刊来指导他们的科学思维。如果狡猾的人如此倾向,这些聊天机器人可以按需喷出大量引用伪科学,解释为什么疫苗不起作用,或者为什么全球变暖是个局。在线发布的误导性材料可能会被未来的生成人工智能吞噬,产生新的谎言迭代,进一步污染公共话语。

贩卖怀疑的商人肯定已经摩拳擦掌,迫不及待了。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

银河链

[0:15ms0-1:703ms