Midjourney CEO大卫·霍尔兹:AI应该是我们自身的延伸

腾讯科技讯7月7日,MidjourneyCEO大卫·霍尔兹在2023世界人工智能大会上发言,认为AI将成为创造和想象力的新的载体和引擎。通过AI,我们有可能放大整个人类种族的原始想象力。针对公司的名字Midjouney,霍尔兹表明它来自于道教著作《庄周》中的中道概念,他认为中国古典文学带来了很多最美丽的,最深沉的思想。

目前Midjouney正在进行5.3版本的开发,并会在版本6中提供一系列对生成图像进行缩放,平移来自动生成新的不同角度相关图像的能力,并且可以控制生成图像的随机性,让作者在诡异的美和令人迷惑的画面间找到平衡。在未来,Midjourney的目标是发展出三维,实时,动态可调的生成图像。

关于技术的未来,他并不确定可能的走向。但融合模型(图像 /文字用的模型进行融合)可能是比较可能的发展方向。他认为AI的这次技术进步的潜力还没有完全发挥出来,比现在强上十倍,百倍的进步是必然的。

他认为到目前为止技术上的大部分进步都来自于试图让人变得更好,试图放大人的能力。因此AGI也许并非是必要的,AI作为我们人的延伸,赋能人类才是更好的选择。

AI作画应用Midjourney疑似已开通QQ频道:5月16日消息,AI作画应用Midjourney中文版疑似已开通QQ频道,并且有官方认证图标。该频道每周一、五下午 6 点统一开放,达到一定人数后会关闭入口。据称,MJCN 只有这一个频道。有推特用户发现,背后运营公司为南京鹏羽辉科技有限公司。[2023/5/16 15:05:05]

以下为演讲实录:

大家好,我是大卫·霍尔兹,Midjourney的CEO和创始人. 我很荣幸受上海市政府邀请我参加这次人工智能世界大会,并很期待加入今天的活动。

世界上最重要的技术之一就是引擎。引擎是一种用于产生、转移或放大的机器。我们使用引擎在各种工厂建造各种各样的交通工具,如汽车、飞机和船只。而现在,是时侯把人工智能看作一种新型引擎了。

在 MidJourney,我们正试图用这种引擎来打造一种新型的载体,这载体不是交通工具,而是承载我们的思维和想象力的载体。

Coatue普通合伙人Luca Schmid和Sebastian Duesterhoeft已离职:10月8日消息,援引知情人士报道,帮助领导其私人科技投资的Coatue Management普通合伙人Luca Schmid和Sebastian Duesterhoeft已离开这家总部位于纽约的对冲基金公司。Schmid计划与Checkout.com创始人Guillaume Pousaz合作成立家族办公室,以投资金融科技初创公司,Duesterhoeft将作为合伙人加入Lightspeed Venture Partners。据悉,Schmid曾领导了该公司的一些顶级加密投资,包括Chainalysis、Fireblocks和Dune Analytics等。[2022/10/8 12:49:40]

就像你可以用足球转动世界,但仍需要腿去踢球一样。我们希望能创造一种新型的载体,你可以用它来进行想象,而不仅是产生运动。在我们创造之前,我们必须首先去想象,想象我们能成为什么,我们可以去哪里,什么是可能的。我认为我们制造的工具,比任何东西都更专注于放大想象力的原初力量。我们有机会放大的不仅仅是任何个体,而是整个人类种族的想象力。我曾多次随Leap Motion(手势识别设备)访问过中国,Leap Motion的第一个办公室就在上海。上海有一种特殊的感觉,我非常喜欢,它似乎是旧金山、洛杉矶、纽约以及一些欧洲老城市的组合体。它拥有一种古老历史和文化的力量,同时也有一种未经雕琢的未来感。这真的很酷,这是我最喜欢的两件事。

a16z普通合伙人Chris Dixon登顶《福布斯》2022年全球最佳风险投资家“Midas List”榜首:4月13日消息,Andreessen Horowitz(a16z)普通合伙人Chris Dixon荣登《福布斯》(Forbes)2022年全球最佳风险投资家“Midas List”榜首。据福布斯4月12日报道,Dixon将3.5亿美元的加密基金I(Crypto Fund I)在2021年转化为60亿美元的已实现和未实现收益。据“了解该基金财务状况的消息人士”称,这相当于17.7倍的惊人收益。

相比之下,整个加密货币市场市值仅从2021年1月1日的7800亿美元增长到同年12月底的2.3万亿美元,增幅为200%。(Cointelegraph)[2022/4/13 14:21:39]

事实上,我基本上是个科幻小说的狂热读者,而我看到的最疯狂的设定来自于中国古典文学。我认为古代中国文学拥有人类历史上最美丽、最深沉的思想。MidJourney(中道)这个名字实际上源于我最喜欢的一个古老道家文本的翻译,它出自《庄周》。比如《庄周梦蝶》、《子非鱼》、《庖丁解牛》、《不材之木》、《空舟》,我喜欢这些。我喜欢MidJourney这个名字的原因是,我觉得人们有时容易忘记过去,可能会感到迷茫,对未来感到不确定。但我更多的是觉得我们其实是在中途旅程,我们来自丰饶美丽的过去,前方是荒野而不可思议的未来。

金属供应商Midwest Tungsten正计划接受加密货币:10月20日消息,金属供应商Midwest Tungsten正计划接受加密货币,该公司已成为日益壮大的钨立方加密货币爱好者社区进入钨市场的入口。上周,CoinDesk报道称,Midwest Tungsten的钨立方零售价格在一周内上涨了300%。当时,该公司表示正在考虑接受加密货币。现在,该公司表示将通过与比特币支付处理器OpenNode的合作伙伴关系来处理比特币。彭博社最近指出,钨(一种典型的立方体金属,主要特征为光滑的外观和密度)最近已经成为一种meme商品,加密交易员和其他市场参与者对钨的兴趣激增。CMS Holdings和Castle Island的Nic Carter都是最近加入钨潮流的加密行业相关方。(The Block)[2021/10/20 20:42:53]

我们最近发布了Mid Journey 5.2版本,现在正进行着5.3版本的开发。之后我希望能发布一个重大更新版本,我希望称之为版本6。我们引入的最新特性是关于图像的缩放,并在你缩小的同时,可以创造不同的故事和环境,围绕中心主题进行变化。这周我们将发布一个类似的功能,它允许你移动相机,然后当你横向移动相机时,可以不断改变提示,然后讲述故事,我们还发布了这个奇特的控制系统,可以结合这些新功能来更好地控制图像生成。

动态 | SEC正与涉嫌ICO欺诈的Reginald Middleton及其公司进行和解谈判:SEC正与涉嫌1500万美元ICO欺诈的Reginald Middleton及其公司Veritaseum Inc.及Veritaseum LLC进行和解谈判。据此前报道,美国SEC对一名纽约男子及其两家公司提起诉讼。SEC指控这些实体在2017年末至2018年期间进行欺诈和未经注册的ICO,并要求美国地方法院对被告的相关资产进行紧急冻结。SEC正式对Reginald Middleton、纽约公司Veritaseum Inc.和总部位于特拉华州的Veritaseum LLC提起诉讼。SEC表示,从2017年末到2018年初,被告通过ICO筹集约1480万美元,并声称向投资者做出了重大虚假陈述和疏漏。此外,SEC认为,该ICO还有大约800万美元的投资者收益,并要求立即请求救济,以便冻结被告的资产。根据提交的文件,这些公司出售了名为VERI的代币,这些代币是在以太坊区块链上发行的,并以30:1的比例与ETH挂钩。(Fnance Feeds)[2019/10/9]

你也可以将其与风格控制相结合。“风格控制”略有点混淆,但是这个想法是,你想要告诉AI想生成多美的产物,你要承担多大的风险来制造这种美。哪怕它是非常规的,混乱的,奇特的,但有时结果真的非常出色。

有时你需要勇于冒险,这让人们可以控制风险性和美的随机性之间的平衡,或者是平衡对图像的常规普遍美予以多少关注。我们还引入了一种我们称之为涡轮模式的东西。涡轮模式就是我们尽可能多地使用GPU,使图像产生非常快。这让生成的速度提升了4到5倍。这个模式让你好像在用64个或100个以上的GPU去生成图像。能达到这个算力,你的计算机大概得值50万美元。这听起来多少有点疯狂,而我们还在研发更疯狂的技术。虽然它们大部分还在酝酿之中,但我们认为随着时间的推移,Midjourney将发展为不仅能创造二维图像,而且能创造三维图像,动态图像,你甚至可以与像素本身交互。在将来也许你能实时回流和重塑的你画出来的东西。

人们只需要这样一个庞大的AI处理器,然后它就可以梦想所有的不同世界,而且梦想可以与我们的思维互动。而我们从某种意义上是通过它(AI)在做梦,那将是真正酷的事。Diffusion模型、Transformer模型、Clip模型的依次发现,实际上让AI开始进入图像空间。大约在2年前,任何图像AI服务都还没有出来时,我们所有的研究者在旧金山交流,我记得我当时说这些模型,特别是Diffusion模型的横空出世肯定会带来完全不同的东西。还有生成对抗网络技术,这是大家在之前用来制作图像生成的基本技术。

我只记得每个人都以一种不寻常的方式立刻点头,说Diffusion模型真的不一样。那一时间气氛非常严肃,我有了一种必须参与其中,并给这个技术带来更人性化的用户界面的强烈感觉。

但是关于未来,我们很难确知技术会如何发展。有时我们会谈论现在如何将语言模型转向Diffusion模型,也即使用Diffusion模型来制作文本。或者说图像模型会变得更像语言模型。这到底怎么达成呢?这种方式的技术术语是自回归Transformer,或者说AI会向着混合模型发展。但这真的很难说。我认为我们只是在这场变革的开端,但我百分之百确定还有很多进步要去取得。比现在十倍,一百倍的进步很可能是必然的。

这种进步不仅体现在性能上,而且体现在让我们更好使用这些技术的用户界面和产品上。无论是个体还是集体都可以制造出真正酷的东西,可以更好地解决问题。道格拉斯·恩格尔巴特是第一个创建文本编辑器的人。最初,人们是通过打孔卡或卡片上的打孔来编程计算机。但道格拉斯开始思考,如果我们用计算机编程计算机会怎样,这在那时候听起来很疯狂。他的想法是,通过在计算机上编程计算机可以加速这个循环,使我们做的更好,使计算机更强大,放大一切。这种想法最终实现了。尽管我们有这些不同的文化,比如AI,人机界面,智能应用文化,我认为到目前为止技术上的大部分进步都来自于试图让人变得更好,试图放大人的能力。

我们还没有真正看到AI时代降临,在那时我们会有独立的AI去解决问题。但如果我们过多地考虑朝着那个方向发展,可能会错失技术中现存的很多机会。我不仅思考AI能做什么,而且思考如何在不同的事物之间创造流动性和纠缠。因为工具不应该感觉像一个人,它应该感觉像你自己,你的身体,你的思想的延伸。我在想如何构建这些技术,让人和AI相互交织起来,感觉不像是你正在与艺术家合作,而更像是你在想象一些东西,然后它就出现在屏幕上。很多人在描述我的旅程时,都觉得那些目的地就像是他们思想的一部分。我认为这就是大部分AI应该成为的样子,它应该是我们自身的延伸。

所以我想再次向陈先生和全体观众表示感谢。WAIC非常酷,我希望我能在将来亲自参加,成为这个活动的一部分。我很期待与中国有更多的合作,我记得我在那里的所有美好的亲身经历,希望大家在那里也能享受互动的乐趣。谢谢。

腾讯科技

媒体专栏

阅读更多

金色早8点

Odaily星球日报

金色财经

Block unicorn

DAOrayaki

曼昆区块链法律

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

银河链

SHIB日本即将解禁稳定币 对市场有何影响?

从政策面着手助力 Crypto 发展的不止有香港。就在昨天,日本实施了修订后的《资金结算法》,并将稳定币定义为一种新的“电子支付方式”,进一步明确了稳定币在日本法律框架中的地位,并制定了详细规则以规范稳定币在日本国.

[0:0ms0-1:408ms