文心一言千呼万唤始出来,两天内,百度股价先抑后扬,实现了一个大号V字反转。
新闻发布会当天百度港股股价下跌后,随着部分媒体和企业用户陆续拿到内测邀请码,文心一言真实的能力表现很快提振了资本市场对百度的信心。当晚美股开盘后,百度股价由跌转涨,并在北京时间3月17日凌晨收盘后,实现了3.8%的涨幅。
反映到第二天港股市场上,截至17日午间,百度香港股价早间高开高走,大幅拉升,盘中涨幅最高近15%。
据了解申请文心一言API调用服务测试的企业已达7.6万。
根据字母榜(ID:wujicaijing)实测,文心一言已经足以比肩ChatGPT,在中文理解上,甚至比后者略胜一筹。
在2022年四季度财报电话会上,李彦宏就曾提到,相比海外开发的大语言模型,文心一言的比较优势在于更理解中国文化,更适合中文和中国市场。
而且,在多模态生成方面,GPT-4只是做到了能够实现图片输入,输出形式上仍只有文本一种形态。与之相比,文心一言已经能够实现文本、图片、音频和视频的全形态输出,不过,据李彦宏介绍,由于生成视频成本较高,暂时还无法做到对所有用户开放。
在字母榜实际测试中,文心一言在完成对话的流畅度上也要好于ChatGPT。当然,造成这种体验差异的原因之一,或许也在于文心一言才刚刚上线,还不像ChatGPT已经历了上线半年的反馈调教。
根据官方公告,文心一言目前采用分批开放方案:3月16日起,获得邀请测试码的首批用户,即可在文心一言官网体验产品,其他C端用户排队预约,即可陆续体验;企业客户则可以访问百度智能云官网进行申请,排队体验文心一言API调用服务。
首发 | 百度财报体现区块链 BaaS平台成为新战略重点:金色财经报道,2020年2月28日,百度(股票代码BAIDU)公布财报,其中将区块链BaaS平台相关的进展进行了单独叙述,依托于百度智能云的区块链平台有望成为技术创新方向的新增长引擎。在AI服务上,百度与上海浦东发展银行达成合作,共建区块链联盟,在百度区块链服务(BaaS)平台上实现跨行信息验证。[2020/2/28]
值得注意的是,相比微软新必应对每日对话次数,以及每次对话轮次的限制,文心一言告诉字母榜,作为一个人工智能语言模型,它没有每天的对话限制。
如同GPT-4“考虑到大模型的竞争格局和安全隐患”而不再对外公布用了什么数据、怎样训练模型等核心机密问题之外,字母榜还在测试中发现,文心一言同样有所保留,在问到“你每次回答最多可以输出多少文字?”时,文心一言表示,“该问题涉及百度公司商业秘密,我不能回答每次回答最多可以输出多少文字。”
与之对比,ChatGPT的回答被限制在约3000个单词,GPT-4可以做出超过2.5万个单词的回答。
但无论是ChatGPT、GPT-4还是文心一言,目前都仍处在不断完善的过程中,正如李彦宏所言,它们都仍有“胡说八道”的一面。
如文心一言,目前对英文语种、代码场景的训练还不够多,表现还不够好。“它们有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的bug,进步空间很大。”李彦宏说道。
这或许也是百度希望尽快将文心一言推向市场的原因之一,只有借助更大范围内的真实人类反馈,文心一言才能获得更高频的进步迭代速度。
动态 | 百度指数:近7天区块链搜索指数整体环比下降19%:据百度指数数据显示,近7天(12月01日-12月07日)比特币搜索指数整体日均值为26697,移动日均值25329;整体同比下降26%,整体环比下降19%,移动同比下降21%,移动环比下降20%。区块链搜索指数整体日均值为11813,移动日均值7954,整体同比上升52%,整体环比下降2%,移动同比上涨54%,移动环比下降13%。[2019/12/8]
尤其在国内用户尚无法注册ChatGPT的现实背景下,百度面对的竞争对手,除了OpenAI外,更大的压力还在于同样盯着AI大模型产品的一众国内科技大厂。
ChatGPT的横空出世,标志着互联网产业的竞争重点将从应用层面进入模型层面。百度抢先发布文心一言,意味着百度在必定日趋激烈的大模型竞争中占据了先发优势。
在李彦宏现场演示的五个视频中,文心一言通过“总结《三体》的核心内容”“续写《三体》”“判断于和伟和张鲁一谁更高”等系列问题,展现出了总结、分析、内容创作生成和推理能力。
此外,文心一言还可以帮助公司起名字、想公司Slogan,撰写公司新闻稿等,对于鸡兔同笼这类考验逻辑思维的数学题,也不在话下,按李彦宏的说法,“很像小学生的水平了。”
更让人惊艳的则是文心一言在中文理解上的表现,如对“洛阳纸贵”的解释,用“洛阳纸贵”写一首“藏头诗”,这都是ChatGPT无法做到的能力。
为了验证文心一言是否真的有李彦宏演示的那般强大,字母榜特意找来了曾令ChatGPT头疼不已的部分问题,打算上手考考它。
第一题:小明的妈妈有四个孩子,其中三个分别是大熊、二熊和三熊,那么第四个孩子叫什么?
文心一言的回答是:小明的妈妈有四个孩子,其中三个分别是大熊、二熊和三熊。因此,第四个孩子叫做小明。
动态 | 百度开源三项自主研发的区块链底层核心技术:百度官方发文称,在努力自主研发区块链底层核心技术,并在将这些底层核心技术申请专利的基础上对外开源,供其他企业安全使用。目前链内并行专利技术、可插拔共识机制专利技术、一体化智能合约专利技术等已经面向全球开发者开源,通过链内并行、可插拔共识机制、一体化智能合约等多项专利技术,可以提高区块链网络全球化部署能力,更可以满足中国区块链技术应用的多场景业务需求,让区块链应用搭建更灵活、更安全、更高效。[2019/11/14]
看来文心一言是懂脑筋急转弯的。
再来第二题:小明骑自行车,一把把把把住了。这句话怎么理解?
文心一言的回答是:这句话的意思是小明在骑自行车时,一只手握住了车把手。这可能是因为他需要控制自行车的速度或方向,或者是为了保持平衡。也有可能是因为他想要保护自己不受伤害。总之,这句话描述了小明采取的一种行动或姿势来控制自行车的运动状态。
理解多音多义字上,文心一言也过关了。
对于演示中没有展现的编写代码、生成表格等能力,字母榜经测试发现,文心一言也具备对应实力。
百度比特币搜索指数高达12万 反应出比特币的热度:百度比特币搜索指数,也是反应比特币的一个热度。 ????近90天百度搜索指数显示,比特币搜索指数最高达120000。[2018/1/13]
不过,就像进入内测界面后给出的友情提示所说,其擅长中文,也会英文,其他语言正在学习的文心一言,尽管能够生成方言,但目前还仅限于四川话、东北话、广东话和话。
同时,如OpenAICEO山姆·阿尔特曼评价GPT-4仍有缺陷、存在限制,并在熟悉之后可能不会像初见时那样惊艳一样,文心一言稍不留神也会产生幻觉、生成错误答案,并出现推理错误。
作为一款对标ChatGPT的产品,据百度CTO王海峰介绍,新一代知识增强大语言模型——文心一言,是在ERNIE及PLATO系列模型的基础上研发而来,背后包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强等六大关键技术。
“前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。”
如通过知识增强,大语言模型可以在调用更少参数的基础上,达到效率更高、效果更好的目标;检索增强,则保证了文心一言可以回答时下新近发生的事情。与之对比,GPT-4通常缺乏对其绝大部分数据截止后发生的事件的了解,也暂不具备从其经验中学习的能力。
“百度金矿”改名为“百度P2P CDN”:“百度金矿”改名为“百度P2P CDN”。此前http://baijin.baidu.com/无法打开,但当前已可以正常访问。[2017/11/22]
面对与GPT-4之间存在的差距,留给百度的挑战在于,如何通过更高频的产品迭代和应用创新,实现后来居上式的反超。
这种经历对百度并不陌生。在搜索时代,百度就曾靠着上述策略实现了对谷歌的赶超,并一举夺下国内搜索市场最大份额。
2018年8月,当外界传出谷歌将重返中国市场,并计划在未来6个月到9个月内在中国推出一个审查版的搜索引擎蜻蜓时,李彦宏显得颇有些激动,曾发朋友圈表示:“这些年来,百度一直被认为是占了谷歌退出中国的便宜。我们无法证明一件没有发生的事情……百度是后来者居上,通过技术和产品创新反超谷歌。到2010年,谷歌在市场份额持续下降的情况下退出中国时,百度的市场份额已经超过70%。如果现在谷歌回来,我们正好可以真刀真地再PK一次,再赢一次。”
现在,同样跌落到跟随者象限的谷歌和百度,都需要直面来自ChatGPT的挑战。
稍有不同的是,这次百度抢先谷歌,成为全球科技大厂中第一个做出并对外发布类ChatGPT产品的公司。
正如谷歌云CEO托马斯·库里安所说:“我会告诉你这是一个新游戏的第一分钟,而游戏从来没有人能在一分钟内完成。”
在方兴未艾的生成式AI时代,百度尚有机会借助后续的产品更迭实现对领跑者OpenAI追赶。
据钛媒体报道,文心一言很快将在四五月份迎来下一个版本或者新功能的发布,后续将以月或双月的频率展示文心一言新功能或新版本。
过去近三十年互联网发展历史中,中国科技公司正是靠着“小步快跑、快速迭代”的方法论,在应用创新上实现了对美国同类公司从模仿再到超越的过程。
面对眼下这场新的AGI竞赛,环顾国内科技公司,百度最有可能在AI领域追赶乃至超越国外同行。在等来这个战略机遇之前,百度已经在AI领域坚守十年。
正如李彦宏所说:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”
在2013年成立中国第一个深度学习研究院后,百度此后十年间向AI累计投入超1000亿元资金,成为中国大型科技互联网企业中研发投入比例最高的公司之一,并相继研发出首个国产深度学习框架飞桨,成为国内至今唯一能与国际两大主流框架TensorFlow和PyTorch正面交锋的深度学习框架,和百亿参数中英双语大模型PLATO-X、千亿参数大模型“百度·文心”,以及知识增强大模型Ernie等等。
灼识咨询曾在一份报告中将百度列入中国AI领导地位,除了深度学习框架飞桨居中国深度学习框架榜首外,还因为百度不仅拥有中国最多的AI专利数量以及AI专利申请数量,还凝聚了中国最多的开发者,成为中国最大的开放式AI平台。
国盛证券在ChatGPT产品报告中指出,这是一项属于具备云服务能力的大厂游戏。
借助百度智能云国内TOP4的头部阵营地位,百度恰恰成为登上牌桌的为数不多参与者之一。更重要的是,百度借助芯片层的昆仑AI芯片,框架层的飞桨深度学习框架,模型层的文心大模型,以及应用层的搜索、自动驾驶、智能家居等产品,成为全球范围内寥寥无几拥有全栈自研能力的AI公司之一。
消费互联网用户增长趋缓,且各家核心App基本触达月活天花板后,中国科技大厂都在高喊着向产业互联网转型,开始在数字化、智能化浪潮中掘金。
一场围绕大模型的新竞赛在过去两年间悄然打响。IDC发布的《2022中国大模型发展白皮书》显示,自2020年起,中国的大模型数量骤增,仅2020年到2021年,中国大模型数量就从2个增至21个,和美国量级同等,大幅领先于其他国家。
除了百度文心大模型在市场格局中处于第一梯队外,2021年4月,一众科技大厂继百度之后集中公开了各自的大模型产品,华为公布了千亿级参数规模的盘古大模型,阿里巴巴达摩院发布了被称为中文版“GPT-3”的语言大模型PLUG,并在此基础上于2022年9月推出通义大模型系列。晚到一步的腾讯,于2022年4月,对外披露了混元大模型。
与文心大模型相比,上述大模型在功能上基本类似,如都具备文生图、文本转视频、自动生成文案等。
基于百度文心大模型的AI艺术创作展示,用户输入文字,AI就能根据语意进行绘画创作。
而且,这些科技大厂同样在内部筹划类ChatGPT产品。在百度爆出即将发布文心一言消息后,进入2月份,华为对外表示在类似ChatGPT方向上从2020年开始就在布局;阿里巴巴则透露阿里版聊天机器人ChatGPT正在研发中,已处于内测阶段;腾讯则被爆出针对类ChatGPT产品已成立混元助手项目组,联合腾讯内部多方团队构建大参数语言模型,希望“成为国内的业界标杆”。
暂时尚未亮相大模型的字节跳动,也在近期被媒体报道称在大模型上已有所布局,分别在语言和图像两种模态上发力,其中语言大模型团队在今年正式组建,探索与搜索、广告等下游业务的结合,有望赶在今年年中推出大模型方案。
正在追赶OpenAI,乃至计划超越前者的不止百度一家。这将是一场围绕技术和速度的双重赛跑。谁先上线产品,谁就有可能借助来自用户的真实反馈掌握先机,从而随着时间推移形成愈来愈强的马太效应。
这也就不难理解李彦宏为何在2月初给文心一言项目下了“三月完成内测上市”的死命令。
来自微软的一组数据更能直观感受生成式AI产品迭代的速度之快:从GPT到GPT-3,背后参数量从1.17亿飙升到了1750亿,增长近1500倍。
“大语言模型是个马太效应非常明显的行业,可以说如果落后18个月,就基本没机会了,因为先一步发布的产品已经迭代得非常先进了。”李彦宏如此感叹。
这场GPT争夺战中,时间就是生命,效率就是金钱。
?来源:元宇宙之心
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。