Generative AI:一个充满创造性的新世界

一类强大的新型大型语言模型正在使机器有可能以可信的、甚至有时是超人类的结果来书写、编码、绘画和创造。人类善于分析事物。但机器可能做的更好。机器可以分析一组数据,并在其中找到模式,用于多种用途,无论是欺诈或是垃圾邮件的检测,预测你的快递的ETA,还是预测下一步该给你看哪个TikTok视频,等待。它们在这些工作上变得越来越聪明。这样的机器被称为"分析型AI",或传统AI。

但人类不仅擅长分析事物,也擅长创造。我们写诗、设计产品、制作游戏以及编写代码。直到最近,机器还没有机会在创造性工作方面与人类竞争。但是,机器才刚刚开始善于创造有意义和美丽的东西。这一新类别被称为"生成型AI",意味着机器正在生成新的东西,而不是分析已经存在的东西。

生成型AI正在不断改变,不仅只是更快、更便宜,同时也在某些情况下创造的东西可能比人类手工创造的更好。每一个需要人类创造原创作品的行业都有可能被它们重新来过。某些功能可能会被生成型AI完全取代,而其他功能则更有可能在人类和机器之间紧密的迭代创造周期中茁壮成长,但生成型AI应该在广泛的终端市场中释放出更好、更快、更便宜的创造力。我们对此的梦想是,生成型AI将创造和知识工作的边际成本降至零,产生巨大的劳动生产率和经济价值,以及相应的市场容量。

生成型AI所涉及的领域覆盖着数十亿的工人。生成型AI可以使这些工人的效率和/或创造性至少提高10%:他们不仅变得更快、更有效,而且比以前有更强的能力。因此,生成型AI有可能产生数万亿美元的经济价值。

为什么是现在?

生成型AI与更广泛的AI都有着相同的"为什么是现在"的疑虑:更好的模型,更多的数据,更大的计算。这个类别的变化比我们所能捕捉到的要快,但也值得我们来概括性地回顾一下最近的历史,以便把当前的时刻也放在背景中。

LatentTechnology宣布完成210万美元融资:2月8日消息,LatentTechnology宣布完成210万美元融资,SparkCapital和RootVentures领投,BitkraftVentures参投。该公司使用基于AI的动画技术和真实世界的物理学,使虚拟世界中的角色能够实时地在物理上精确移动。(reportdoor)[2023/2/8 11:53:35]

浪潮1:小型模型至上。

5年多以前,小型模型被认为是理解语言的"最先进的技术"。这些小型模型擅长分析任务,并被部署在从预测交付时间到欺诈分类的工作中。然而,对于普遍的生成任务来说,它们的表达能力还不够强。生成人类水平的写作或代码仍然只能是一个梦想。

浪潮2:规模竞赛。

谷歌研究院有一篇里程碑式的论文,描述了一种用于自然语言理解的新型神经网络架构,称为transformers,它不仅可以生成质量上乘的语言模型,同时还具有更高的可并行性,需要的训练时间也大大减少。这些模型是少数的学习者,因此可以相对容易地针对特定领域进行定制。

当然,随着模型越来越大,它们开始提供与人类相当的水平能力,然后是超人类的成果。从2015年到2020年,用于训练这些模型的计算量增加了6个数量级,其成果在手写、语音和图像识别、阅读理解和语言理解方面超过了人类性能的基准。OpenAI的GPT-3脱颖而出:该模型的性能不仅比GPT-2有了巨大的飞跃,并且在他们提供的充满吸引力的Twitter演示中也能看出,不管是在代码生成还是冷笑话写作等任务上,它的表现都令人大开眼界。

2023年金融科技趋势:银行、支付、区块链、监管科技等:金色财经报道,近年来,金融科技一直在兴起,随着对处理金融服务的数字解决方案的需求不断增长,这一趋势预计将持续到 2023 年。因此,对管理金融服务的数字解决方案的需求不断增加,预计到 2023 年,全球金融科技市场?的总规模将达到?3050 亿美元。预计2023年越来越多地采用?DeFi 和区块链技术。区块链技术的使用在过去几年中一直在稳步增加,因为它能够以安全的方式可靠地存储数据并进行可信赖的交易,而无需第三方充当中介。

此外,许多不同的金融科技组织正在将其作为简化业务流程、减少欺诈活动并提高向客户提供的服务质量的一种手段。稳定币等 DeFi 协议的未来可以提高流动性、成本节约和稳定性。[2023/1/9 11:01:53]

尽管所有的基础研究都取得了进展,但这些模型并未得到普遍应用。它们体积庞大,难以运行,不能广泛使用,而且作为云服务使用的费用昂贵。尽管有这些限制,但最初的生成型AI应用也开始进入“战场”。

浪潮3:更好、更快、更便宜。

计算变得更便宜。新技术,如扩散模型,缩减了训练和运行推理所需的成本。研究界也在继续开发更好的算法和更大的模型。同时开发者的权限也从封闭测试版扩大到开放测试版,甚至在某些情况下,还开放了源代码。

对于那些一直对大型语言模型的使用较少的开发者来说,那么现在就是探索和应用开发的闸门大大开放的时候,各色应用也开始绽放。

FTX US:ETH提款将很快恢复:据官方消息,FTX US的ETH提款将很快恢复。此外,Matic提款仅支持提取到以太坊主网。[2022/11/11 12:50:32]

浪潮4:杀手级应用的出现。

随着平台层开始巩固,模型继续变得更好、更快、更便宜,以及模型的访问/使用趋向于免费和开源,应用层的创造力爆发的时机已经成熟。

正如移动通信通过GPS、相机和随身连接等新功能催生出了新类型的应用,我们预计这些大型模型将激励新一波生成型AI应用的诞生。正如十年前移动通信的拐点为少数几个杀手级应用创造了一个市场缺口一样,我们预计杀手级应用也将出现在生成型AI当中。如今,比赛正在激烈进行当中。

市场格局

下面是一个示意图,描述了将为每个类别提供动力的平台层,以及将建立在其上的潜在应用类型。

模型

文本:文本是最先进的领域。然而,语言表达自然流利却是很难做好的,而且质量也很重要。今天,这些模型在普遍的短篇/中篇写作方面还算不错。随着时间的推移,随着模型变得更好,我们应该期望看到更高质量以及更长篇的内容输出,除此外,针对各垂直领域能够更好的进行优化调整。代码生成:如GitHubCoPilot所示,代码生成很可能在短期内对开发者的生产力产生很大影响。它也将使非开发者更容易获得对代码的创造性使用。图像:图像是一个较新的现象,但它们已经开始像病一样的疯狂传播:在Twitter上分享生成的图像比文字要有趣得多。我们也看到许多具有不同审美风格的图像模型的出现,以及编辑和修改生成图像的不同技术。语音合成:语音合成已经存在了一段时间,但消费者和企业应用才刚刚起步。对于像电影和播客这样的高端应用来说,要想一次性获得听起来不那么机械的人类质量的语音,其标准是相当高的。但就像图像一样,今天的模型为进一步完善或为实用性应用的最终输出提供了一个起点。视频和3D模型:视频3D模型领域正在迅速崛起。人们对这些模型在这一创意市场中具有的无限潜力而感到兴奋,如电影、游戏、VR、建筑和物理产品设计。研究机构也正在发布基础的3D和视频模型。其他领域:许多领域都在进行基础模型的研发,从音频和音乐到生物和化学下面的图表说明了我们可能期望看到的基础模型的进展和相关的应用成为可能的时间表。2025年及以后只是一个猜测。

交易聚合协议OpenOcean已集成QuickSwap:10月21日消息,DEX与CEX交易聚合协议OpenOcean宣布已集成Polygon上DEX QuickSwap。[2022/10/21 16:34:54]

应用

以下文字描述的是一些令我们感到兴奋的应用场景。这一页上的应用远比我们所记录的要多,我们对创始人和开发者所梦想的创造性应用感到兴奋。

文案写作:对个性化网络和电子邮件内容的需求日益增长,进一步促进销售和营销策略以及客户支持,这些都是语言模型的完美应用。简短的形式和风格化的言语,加上这些团队的时间和成本压力,应该推动对自动化和增强型解决方案的需求。

垂直特定领域的写作助手:今天的大多数写作助手是横向的;我们相信有机会为特定的终端市场建立更好的生成型应用,从法律合同写作到编剧。这里的产品差异化在于对特定工作流程的模型和用户体验模式进行微调。

代码生成:目前的应用为开发者提供了极大的动力,使他们的工作效率大大提升。GitHubCopilot现在在安装它的项目中生成了近40%的代码。但更大的机会可能是为普通消费者打开了编码的通道。提示学习可能成为最终的高级编程语言。

艺术生成:整个世界的艺术史和流行文化现在被编码在这些大型模型中,允许任何人随意探索以前需要用一生才能掌握的主题和风格。

eToro将裁员6%,正式宣布终止SPAC交易并计划私募融资:7月7日消息,多资产投资交易平台eToro表示其将裁员100人,约占公司员工总数的6%。 此外,Etoro还透露,公司将终止与Fintech acquisition Corp.的SPAC合并计划。Etoro表示,公司现在计划私募融资,目标是融资8-10亿美元。

据称,eToro在这笔融资交易中的估值预计约为50亿美元。在取消SPAC交易之前,估计Etoro的估值将在88亿美元至103亿美元之间。(Bitcoin.com)[2022/7/7 1:56:41]

游戏:理想的模式是使用自然语言来创建复杂的场景或可操纵的模型;这种最终状态可能还很遥远,但有一些更直接的选择在短期内更可操作,如生成纹理和天空盒艺术。

媒体/广告:想象一下将代理工作自动化的潜力,并为消费者优化广告文案和创意。在这里,多模式生成的机会很大,可以将销售信息与互补的视觉效果配对。

设计:数字和实物产品的原型设计是一个劳动密集型且不断反复的过程。从粗略的草图和文字提示中来实现高保真渲染图已经成为现实。随着3-D模型的出现,生成设计的过程将朝着制造和生产方向延伸。在未来,你的下一个iPhone应用或运动鞋可能是由机器设计的。

社会媒体和数字社区:是否会有人借助AI生成的新方式来自我表达呢?像Midjourney这样的新应用正在创造新的社交体验,因为消费者能够学习使用这项工具在公共场合进行创作和表达。

生成型AI应用的剖析

生成型AI应用会是什么样子?这里有一些预测。

智能化和模型微调

生成型AI应用是建立在GPT-3或StableDiffusion等大型模型之上的。随着这些应用不断获得更多的用户数据,他们可以对模型进行微调,从而:1)为他们的特定问题领域提高模型质量/性能;2)减少模型尺寸/成本。

我们可以把生成型AI应用看作是一个UI层和"小脑",它位于大型通用AI模型这个"大脑"之上。

形式因素

今天,生成型AI应用程序在很大程度上是作为现有软件生态系统的插件存在的。代码完成运行在你的IDE中;图像生成发生在Figma或Photoshop中;甚至Discord机器人也是将生成型AI注入数字/社交社区的一个理想容器。

还有少数独立的生成型AI网络应用,如用于文案写作的Jasper和Copy.ai,用于视频编辑的Runway,以及用于笔记的Mem。

插件可能是一个有效的楔子,一方面可以引导你使用自己的应用程序而不需要引入新的应用,另一方面它也以一种聪明的方式来避免了用户数据和模型质量的鸡和蛋的问题。我们已经看到这种分销策略在其他市场类别中得到了回报,如消费者/社会。

交互范式

今天,大多数生成型AI演示都是"一劳永逸"的:你提供一个输入,机器吐出一个输出,你可以保留它,或者把它扔掉再试。越来越多的模型在不断迭代,也在变得更加强大,未来,你可以对输出的作品进行修改、完善、提升和产生变化等操作。

今天,生成型AI的产出能力被用作生产原型或初稿。应用程序很擅长吐出多个不同的想法,让人们的创意过程也得以进行,它们也很擅长提出需要用户微调才能达到最终状态的初稿。随着模型变得更加智能,其中部分也需要依靠用户数据,我们可以期待这些初稿会变得越来越好,直到它们好到可以作为最终产品使用。

持续的类别领先

最好的生成型AI公司可以通过在用户参与、更多数据和模型性能之间的飞轮而产生持续的竞争优势。要想获胜,团队必须通过以下方式让这个飞轮运转起来:1)拥有卓越的用户参与度→2)将更多的用户参与度转化为更好的模型性能→3)利用优秀的模型性能来推动更多的用户增长和留存。他们可能会进入特定的问题领域来发展,而不是试图成为覆盖所有人的一切。他们可能会首先深入整合到目前人们的应用程序中,从而实现分发和利用自己的程序,然后尝试用AI原生工作流程取代现有的应用程序。用正确的方式建立这些应用程序来积累用户和数据需要时间,但我们相信最好的应用程序将是持久的,并有机会成为大规模的。

障碍和风险

尽管生成型AI潜力无限,但在商业模式和技术方面仍有许多问题需要解决。有关版权、信任、安全以及成本等重要问题还远未解决。

开阔视野

生成型AI仍然是非常早期的。平台层刚刚有了起色,而且应用空间也刚刚开始起步。

说白了,我们不需要大型语言模型的生成型AI来写一部托尔斯泰的小说。这些模型今天已经足够好,可以写出博客文章的初稿,并生成标识和产品界面的原型。有大量的价值创造将在近期至中期内发生。

第一波生成型AI应用类似于iPhone刚问世时的移动应用景观。然而,这些应用中有一些提供了对未来可能出现的有趣一瞥,让我们有了方向。一旦你看到机器产生复杂的功能代码或出色的图像,就很难想象未来机器不会在我们的工作和创造中发挥根本作用。

如果我们允许自己做几十年的梦,那么就很容易想象出这样一个未来:生成型AI已经深入到我们的工作、创造和娱乐中:备忘录可以自己写;3D打印能打印出任何你能想象到的东西;从文字到皮克斯电影;类似Roblox的游戏体验,在我们能想象出它们的时候就能快速生成丰富的世界。虽然这些体验在今天看起来像科幻小说,但科技进步的速度是令人难以置信的,我们在几年内从渺小的语言模型到代码自动完成,如果我们继续沿着这种变化的速度并遵循"大型模型摩尔定律",那么这些遥不可及的场景可能会变的触手可及。

责任编辑:Kate

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

银河链

火币下载DID:对信用和Permissionless的渴求

在上周发出的首尾相连:DID和链上数据构建的去中心化链路一文中,R3PO指出链上数据是一种“下沉”的数据基础设施,需要配合DID作为一种功能套件嵌入进SocialFi、GameFi、钱包等产品之内.

[0:15ms0-1:842ms