撰文:DevinColdewey
来源:TechCrunch
图片来源:由无界AI工具生成
现在的OpenAI可能是机器学习的代名词,而谷歌也正在尽力从地板上爬起来。不过,两者可能很快就会面临一个新的威胁:快速增加的开源项目推动了技术的发展,并将财力雄厚但笨重的公司甩在身后。这种类似于虫族的威胁可能还不存在,但它肯定会使主导者处于守势。
Sam Altman:开源GPT-3、降低GPT-4的成本、翻倍模型规模:6月1日消息,AI 开发平台 HumanLoop 创始人 Raza Habib 与 OpenAI 首席执行官 Sam Altman 等 20 多位开发者开展了一次闭门讨论会,Sam Altman 透露了很多关于 OpenAI 的未来规划与目前遇到的情况。具体有:
1. OpenAI 目前严重受限于 GPU,导致他们推迟了许多短期计划,大部分关于 ChatGPT 可靠性和速度的问题都是由于 GPU 资源短缺造成。
2. 给 GPT-4 降本提效是 OpenAI 当前的首要任务。
3. 更长的 ChatGPT 上下文窗口 (最高可达 100 万个 tokens)。将来会有一个记住对话历史记录的 API 版本。
4. GPT-4 的多模态功能要到 2024 年才会公开,在获取更多 GPU 资源前不能将 GPT-4 的视觉版本扩展到所有人。
5. OpenAI 正在考虑开源 GPT-3,他们之所以还没有开源的部分原因是因为他们觉得没多少人和公司有能力妥善管理如此大型的大语言模型。
6. 最近很多文章声称的“巨型 AI 模型的时代已经结束”并不正确,OpenAI 内部数据表明,规模与性能成正比的定律仍成立,OpenAI 的模型规模每年可能会增加一倍或三倍 (多方信息表明 GPT-4 参数规模 10000 亿),而不是增加许多数量级。[2023/6/1 11:52:59]
这一概念并不新鲜--在快速发展的人工智能界,几乎每周都会看到这种突破--据称来自谷歌内部的一份广泛共享的文件使人们看到了这种情况。“我们没有护城河,OpenAI也没有,”该备忘录写道。
软银旗下科技服务公司LINE计划开源帮助多国央行打造CBDC:日本跨国企业集团软银(SoftBank)旗下的韩国软件和科技服务公司LINE PLUS发布了一个区块链平台,帮助各国央行启动CBDC。目前该项目正在与几家亚洲央行进行谈判。新平台预计将支持KYC以及AML,并具有模块化结构,允许开发人员根据需要添加不同的功能。(decrypt)[2021/7/11 0:42:34]
我不会用长篇大论的方式来概括这篇完全可读且有趣的文章,但其主要内容是,虽然GPT-4和其他专有模型已经获得了大部分的关注,甚至收入,但他们在资金和基础设施方面获得的领先优势看起来越来越小。
虽然以普通主要软件发布的标准来看,OpenAI的发布速度可能显得很快,但如果把它们与iOS或Photoshop的版本相比,GPT-3、ChatGPT和GPT-4是接踵而至的。但这仍是以月和年的规模发生的。
Coinbase开源项目Rosetta实现比特币集成功能:9月23日,Coinbase官方发文宣布,旗下开源项目Rosetta为比特币实现集成功能,即rosetta-bitcoin功能,该功能可以集成比特币核心客户端无法集成的功能,解决比特币集成开发者面临的一些问题,如查询账户余额,以及在不向节点导入私钥的情况下构建交易。[2020/9/23]
备忘录指出,3月份,Meta公司泄露的基础语言模型,称为LLaMA,是以相当粗糙的形式被泄露的。几周之内,人们在笔记本电脑和一分钱一分钟的服务器上修修补补,增加了指令调整、多种模式和从人类反馈中强化学习等核心功能。OpenAI和谷歌可能也在摸索代码,但他们没有——也不可能——复制subreddits和discord中出现的协作和实验水平。
难道说那个似乎对挑战者构成了不可逾越的障碍--护城河--的巨大计算问题,真的已经是人工智能发展的另一个时代遗迹了吗?
动态 | Binance Labs将向三个开源项目提供15000美元的资助:据Cryptimi消息,Binance Labs宣布将向三个开源项目Ironbellly、HOPR和Kitsune提供15000美元的资助。[2019/4/12]
SamAltman已经指出,当向这个问题投掷参数时,我们应该期待回报递减。当然,越大并不总是越好——但很少有人会猜到反而是越小越好。
GPT-4是沃尔玛,但实际上没人喜欢沃尔玛
OpenAI和其他公司现在追求的商业范式是SaaS模式的直接后裔。你有一些高价值的软件或服务,你通过API或其他类似的方式提供精心设计的访问。这是一种直接的、经过验证的方法,当你投入数亿资金来开发像大型语言模型这样的单一单体但又多功能的产品时,这种方法就非常有意义。
如果GPT-4能很好地概括回答关于合同法中先例的问题,那就太好了--别忘了它的大量“智力”都致力于能够鹦鹉学舌,模仿每一个曾经用英语发表过作品的作者的风格。GPT-4就像一个沃尔玛超市。但没有人真的想去那里,所以该公司只能确保周围没有其他选择。
顾客开始怀疑,为什么要穿过50条垃圾通道去买几个苹果?如果我只是想将这份合同的语言与其他几百份合同相匹配,我为什么要雇用有史以来最大且最通用的人工智能模型服务?如果GPT-4是你去买苹果的沃尔玛,那么当停车场的水果摊开门时会发生什么?
在AI世界中,不用过多久,大型语言模型就会以高度截断的形式在RaspberryPi上运行。对于像OpenAI这样的企业,以及其操纵者微软、谷歌或人工智能即服务世界中的任何其他人来说,这实际上是对其业务的整个前提的乞求:这些系统是如此难以建立和运行,以至于必须由他们设计。但事实看起来更像是这些公司挑选并设计了一个适合他们现有商业模式的人工智能版本,而不是相反!
很久以前,你必须把文字处理中涉及的计算工作卸载到大型主机上,因为你的终端只是一个显示器而已。当然,那是一个不同的时代,现在的我们早已能够在个人电脑上安装整个应用程序。这个过程已经发生了很多次,因为我们的设备不断地以指数方式增加它们的计算能力。如今,当某些事情必须在超级计算机上完成时,每个人都明白这只是时间和优化的问题。
对于谷歌和OpenAI来说,时间的到来比预期要快得多。而且他们不是做优化的人,可能永远不会。
这并不意味着他们倒霉。要知道,谷歌并不是通过成为最牛的来获得它如今的地位的--无论如何,在很长一段时间内都不是。成为沃尔玛有它的好处。如果公司能够从现有供应商那里获得合理的价格并且不会造成太大的破坏,那么他们就不会想去寻找定制的解决方案来完成他们想要的任务,将速度提高30%。永远不要低估惰性在商业中的价值!
当然,LLaMA的迭代速度如此之快,以至于已无骆驼的名字可供命名。只是,很少有企业的IT部门会在OpenAI简单有效的API上拼凑实施Stability的开源衍生品--一个准合法的泄露的Meta模型。他们还有别的生意要做!
不过,与此同时,我在几年前就不再使用Photoshop进行图像编辑和创作了,因为像Gimp和Paint.net这样的开源选择已经变得非常好了。在这一点上,争论走向了另一个方向。Photoshop要花多少钱?不,我们还得做别的呢!
谷歌的匿名作者显然担心的是,从第一种情况到第二种情况的距离将比任何人想象的要短得多,而且似乎没有人能对此做任何事情。
不过,备忘录也写道:接受它。开放、发布、合作、分享、妥协。他们总结道:
谷歌应该在开源社区建立自己的领导地位,通过与更广泛的对话合作,而不是忽视它。这可能意味着要采取一些不舒服的步骤,比如公布小型ULM变体的模型权重。这必然意味着放弃对我们模型的一些控制。但这种妥协是不可避免的。我们不能希望既推动创新又控制创新。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。