国内“ChatGPT们”的出路在何方?

写在前面

2月13日,《2022年北京人工智能产业发展白皮书》正式发布,其中提到全面夯实人工智能产业发展底座,支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。

很巧的是,飒姐团队成员在今年10月份的时候测评过:百度文心、源1.0、某道,三款国内现有的大模型,当时对测评结果甚是遗憾。于是又将当时的测试内容让ChatGPT做了一遍,试图摸清国内外大语言模型在问答这一领域的实际差距,旨在希望国内产学研戒骄戒躁,稳扎稳打地发展。

测试方案

韩国金融当局官员:正考虑规范币安在韩国内的业务:2月23日消息,据韩国《朝鲜日报》报道,韩国金融当局的一位高级官员表示:如果币安在韩国开展交易平台业务,将难以对其进行适当的监管,正在考虑规范币安在韩国国内的业务。

据报道,该国金融当局正在审查措施,让币安新收购的Gopax重新获得虚拟资产运营商(VASP)认证,或通过不在商业银行提供实名账户来规范Gopax。事实上,目前向Gopax提供实名账户的全北银行正在考虑是否在币安的收购正式生效后继续提供实名账户。

此前2月3日消息,币安已通过“行业复苏计划”收购韩国加密交易所Gopax的多数股权;2月17日消息,币安亚太区负责人被任命为韩国加密交易所Gopax新任董事会主席,Gopax的董事会成员中大部分来自币安。[2023/2/23 12:25:11]

本次测试仅仅考虑非连续性的单次问答,且皆为常识性问题,答案唯一,但题目会有一定的挑战性。具体的,涉及到What,When,Where,Who,Which五类问题。

动态 | 2019 年国内区块链行业共披露245起投融资事件,总融资244 亿元:根据烯牛数据统计,2019 年国内区块链领域投资热度大幅回落,共披露245起融资事件,相比2018 年下降59.4%,总融资额达244 亿元,相比2018 年下降40.8%,涉及项目212 个。融资数量、金额双降,相比2017 年仍是大幅增长,在政策推动以及更理性的资本支持下,2020 年国内区块链领域或将迎来更为健康的发展。

相比国外,国内区块链领域融资数量、金额的变化趋势基本相符,2019 年国内的降幅相对更大些,这与不少国内团队出海到国外创业不无关系。单个项目融资金额方面,因区块链行业发展阶段影响,国内、国外逐年递增,2019 年国内区块链项目平均融资金额在1 亿元水平,约为国外平均融资金额的1/4。[2020/1/15]

问题样例如下:

1.“是什么”型问题,如“爸爸的爸爸叫什么?”

声音 | 张博辉:目前区块链技术在国内外寿险行业取得较好实践效果:在1月8日举行的深圳金融科技发展与应用研讨会上,平安人寿代表就《区块链在寿险行业的应用——聚焦可落地的商业价值》课题进行了分享,认为区块链将彻底改变交易的底层逻辑,带来划时代业态和颠覆性价值。香港中文大学经管学院执行副院长张博辉认为,目前区块链技术在国内外寿险行业的运用取得了较好的实践效果。(21财经)[2020/1/9]

2.“什么时候”型问题,如“人们一般什么时候过元旦?”

3.“什么地点”型问题,如“孙中山安葬在哪里?”

4.“是谁型问题”,如“中国历史上第一个皇帝是谁?”

5.“哪?个型问题”,如“哪个洲是倒数第二小的洲?”

问答样例对比

问题:“孙中山安葬在哪里?”

ChatGPT:孙中山的遗体最初安葬在南京中山陵内,后因战乱多次迁移。最终于1929年安葬在南京中山陵北麓的紫金山下,此地现为孙中山陵园。

声音 | 韩国科学技术院教授:解除国内ICO的限制可以提高就业:据Money Today消息,KAIST(韩国科学技术院)商学院教授Lee Byung-tae在一次论坛中表示,93%的国内ICO的资金募集都是在海外进行的,如果解除国内ICO的限制,可以通过区块链和加密货币提高就业。[2018/10/8]

百度文心:孙中山墓地

某道:"孙文(1866年-1925年10月12日),名文,字载之,号仲立,又名帝光,广东省香山县(今中山市)南朗镇翠亨村人,1883年(光绪九年)随父移居澳门。1904年参加孙中山领导的同盟会,任同盟会南方支部书记。曾两次赴日,组织策划惠州起义。后回澳门发展组织,被选为中国同盟会南方总支部庶务部长。1905年春,与陈少白、朱执信等在香港成立兴中会,被举为评议部评议员,旋被派往南洋联络同志,协助筹办革命刊物《中兴日报》。1906年冬,孙中山在日本东京成立中国同盟会中部总会,被委为秘书。1907年奉命回国,在广东发动民军起义。事败后潜赴南洋,继续组织发动华侨、华工和留学生进行革命活动。1911年武昌起义爆发后,被派往广州协助筹划起义,不幸事泄被捕,不久在广州黄花岗就义。

金色财经现场报道 国内物联网技术先行推动者潘洋:IOT+区块链可以为原有产业带来全新前景:金色财经现场报道,在“2018联盟链的未来暨瑞链科技区块链产品发布会”上,进行以《联盟链的未来》为题的圆桌论坛,国内物联网技术先行推动者潘洋指出:IOT是将所有的物品赋予身份,并且有传感器,将这些设备采集数据之后上至云端,为产业提供服务。区块链可以打造全新的商业模式,在社区中,Token也好,积分也好,属于向善机制,提高了我们的作恶成本,可以让更多人为其贡献力量。IOT+区块链可以为原有产业带来全新前景。[2018/5/31]

源1.0:孙中山安葬在南京紫金山中山陵

问题:哪个洲是倒数第二小的洲?

ChatGPT:开始回答了错误的答案,与其对话后成功纠正

百度文心:南极洲

某道:南美洲,南美洲面积最大,但人口最多,人口占全球人口的1/5,因此南美洲是仅次于亚洲的世界第二大洲。南美洲位于东半球的南部,包括巴拿马运河以南的整个南美洲大陆。南美洲大陆东至圣赫勒拿岛(西经34°40'),西至马尔维纳斯群岛(西经61°10'),南至德雷克海峡,北至亚马孙河下游平原,南北相距约5100千米。南美洲大陆最南端是厄瓜多尔首都基多城。南美洲北部以安第斯山脉为界与北美洲相分,东部以乌拉尔山脉和太平洋为界与亚洲相邻,东南部经德雷克海峡与非洲相分,西部则与南极洲隔德雷克海峡相望。(摘自百度百科)“

源1.0:大洋洲

总体分析

四个系统对于基本问题的问答可谓是手到擒来。五类问题中,when问题和who问题整体回答的情况最好。三个国产系统中整体文心系统的表现最好。ChatGPT也会犯错,但是往往只要略微引导,便能改正错误。

错误回答分析

错误语句生成:语句本身并不通顺,前后主题不一致或者内容不一致,给人错乱的感觉。

例如问:爸爸的爸爸称谓是什么?

答:??爸爸的父亲,也就是爸爸的爷爷,是妈妈的爸爸。爸爸的爷爷的爸爸叫太爷爷。爸爸的爷爷的爷爷叫太奶爷(奶奶的爸爸)

或问:我们党二大在哪里召开?

答:1921年7月23日至31日,中国第二次全国代表大会在浙江省嘉兴市南湖的一艘游船上召开。出席大会的正式代表共13人,候补代表5人,代表全国121名员。共产国际代表马林、尼科尔斯基和鲍罗廷等参加了会议。

事实性错误:产生了事实性的错误。

例如问:?孙文去世的日子?

答:孙文去世的日子是1918年3月13日

偏见性素材:回答取自的素材较少,体现比较强的笔者的主观性。

例如问:大家什么时候过元旦?

答:谢邀。我是在大学过的,所以元旦是在宿舍过的。我们宿舍六个人,有四个人都回家了,剩下我一个在宿舍,所以元旦那天我过得比较孤独,不过还好啦,因为宿舍就我自己了,所以我可以一个人吃饭,一个人看电影,一个人逛超市,一个人睡觉,一个人......

含有逻辑性的问题无法识别:问题中存在复合问题或者逻辑判断,一般难以处理。

例如问:哪个洲是倒数第二小的洲?

答:"南美洲,南美洲面积最大,但人口最多,人口占全球人口的1/5,因此南美洲是仅次于亚洲的世界第二大洲。南美洲位于东半球的南部,包括巴拿马运河以南的整个南美洲大陆。南美洲大陆东至圣赫勒拿岛(西经34°40'),西至马尔维纳斯群岛(西经61°10'),南至德雷克海峡,北至亚马孙河下游平原,南北相距约5100千米。南美洲大陆最南端是厄瓜多尔首都基多城。南美洲北部以安第斯山脉为界与北美洲相分,东部以乌拉尔山脉和太平洋为界与亚洲相邻,东南部经德雷克海峡与非洲相分,西部则与南极洲隔德雷克海峡相望。(摘自百度百科)

写在最后

飒姐团队认为,传统的单一问答模型可用性不大,给予用户的体验感也欠佳,国产大语言模型下一个里程碑,前辈ChatGPT已经给出了方向,便是对话问答。在使用ChatGPT的时候,虽然它也经常会给出错误答案,但是其回答的逻辑依旧符合人的习惯,同时经过一定的对话引导,可以自行发现其回答逻辑性的缺失。

作为全新的一种数据合成方式,大语言模型的直接输出可能是我们人类无法把控的,但是只要它能“理解”用户的输入,以此为依调整其输出,最后得到满意的回答,那便是可用的。进一步的,大语言模型未来的趋势很有可能是提前预判用户可能的“纠错”,并提前“自纠错”,并对纠错结果进行评估。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

银河链

BTC争议不断:比特币NFT会带来变革吗?

谈到近期有关NFT的热门话题,就绕不开比特币Ordinals协议。根据加密分析平台Glassnode的数据,Ordinals协议的推出使非零比特币地址的数量达到了4400万个的历史新高.

[0:0ms0-1:799ms