一张估值20亿的“笑脸”,正在拆掉OpenAI的围墙

文|Juny??编辑|VickyXiao

由ChatGPT引发的人工智能风潮还在猛烈地刮着。但从各个角度来看,目前这都是一个巨头争霸的战场:更大的模型、更强的算力、更多的用户、更雄厚的资金……这些都似乎成为了想要加入这场角逐的门票。与此同时,核心技术的研究也逐渐开放走向封闭。

而在这高墙正在筑起的过程中,也有一些新锐的创业公司想要高举旗帜来一场革命。其中,尤其引人注目的是一家名为HuggingFace开源创业公司。

目前,HuggingFace已经是全球最受欢迎的开源机器学习社区和平台,不仅创下了GitHub有史以来增长最快的AI项目记录,估值也一路冲破了20亿美元。近期,微软和浙江大学联合发布的一篇关于HuggingGPT的论文更是把HuggingFace推到了舞台中心,也让更多人关注到了当前这股与众不同的人工智能发展力量。

01HuggingGPT火了,Hugging是啥?

本月初,微软亚洲研究院和浙江大学联合发布了一项最新的名为HuggingGPT的研究,介绍了一个全新的协作系统,让开发者能够在ChatGPT的帮助下快速、准确地去选择合适的人工智能模型,从而完成包括文字、视频、语音等多模态在内的复杂任务。

该项目目前已经在Github上开源,还有一个超拉风的名字叫JARVIS。在这个研究中,主要涉及到了两个主体,一个是众所周知的ChatGPT,另一个则是AI社区HuggingFace。

Immutable非托管钱包和身份验证解决方案Immutable Passport测试版已上线:金色财经报道,以太坊 NFT 二层扩容方案 Immutable 联合创始人 Robbie Ferguson 宣布 Immutable 的非托管钱包和身份验证解决方案 Immutable Passport 测试版已上线。 Immutable Passport 的特点包括完全自托管,基于电子邮件 onboarding ,所有游戏共享流动性。

此前消息, ImmutableX 此前计划于 4 月推出其非托管钱包和身份验证解决方案 Immutable Passport,专为 Web3 游戏工作室设计,旨在帮助 Web3 游戏用户管理和简化资金管理体验,用户创建一次 Passport 即可访问由 Immutable 提供支持的所有游戏和市场。[2023/5/4 14:42:53]

图片来自HuggingGPT研究论文

那么HuggingFace是做什么的?

简单来说,HuggingFace是一个针对人工智能的开源平台,用户可以在上边发布和共享预训练模型、数据集和演示文件等。目前HuggingFace上已经共享了超过10万个预训练模型,1万多个数据集,包括微软、谷歌、Bloomberg、英特尔等各个行业超过1万家机构都在使用HuggingFace的产品。

在HuggingGPT中,ChatGPT通过扮演了“操作大脑”的角色,能够自动解析用户提出的需求,接着在HuggingFace的“AI模型池”里进行自动模型选择、执行和报告,为开发者们开发更复杂的人工智能程序提供了极大的便利。

法国农业信贷银行推出基于区块链技术的数字债券平台“so|bond”:金色财经报道,法国农业信贷银行Crédit Agricole CIB宣布和北欧企业银行SEB合作推出基于区块链技术的可持续开放数字债券平台“so|bond”,让资本市场发行方能够在区块链网络上发行数字债券并通过智能合约筹集资金和管理证券,利用去中心化和高效的基础设施实现银行和金融服务部门的现代化和数字化。据悉,该平台开放、透明和安全的模式也促进了市场参与者之间的信任,并允许进一步创新,例如使用未来的央行数字货币(CBDC)。(Ffnews)[2023/4/3 13:42:33]

虽然在模型上ChatGPT跟HuggingFace能够牵手,但从本质上来说,HuggingFace跟OpenAI目前是在做两个相反方向的事。其中最大的不同点在于,在开发者服务方面,OpenAI现在正在搭建人工智能开发的围墙,仅允许满足条件的机构和个人进入,但HuggingFace则希望每个人都可以访问生成式AI模型,包括各类企业和所有普通开发者。

今年2月,OpenAI上线了一个名为Foundry的新开发者平台,允户可以在这个平台上运行OpenAI最新的机器学习模型,但在产品的描述中,OpenAI明确表示Foundry是为运行较大工作负载的尖端客户设计,而根据一份价格表显示,即使是GPT-3.5的轻量级版本,三个月费用高达7.8万美元,一年费用为26.4万美元。

就在Foundry发布后,Huggingface便立刻宣布了其与AWS的最新合作伙伴关系,并发出了“让人工智能走向开放”的呼吁。通过该合作,任何开发人员都将能够使用AWS的托管服务并处理HuggingFace上可用的任何模型。

美参议院银行委员会主席:美国监管机构或应考虑禁止加密货币:金色财经报道,美国参议院银行委员会主席SherrodBrown建议如美国证交会和美国商品期货交易委员会(CFTC)等联邦机构,或许应该考虑禁止加密货币。不过,在会见媒体的会议上,他也承认,这项禁令将“非常困难”,因为加密行业可能会转移到海外。会上他提出了多项可能会由加密货币引发的不良事件,并表示希望美国各监管机构能够做他们需要做的事情。早些时候,他呼吁不同政府机构在管理加密货币时应采取合作方式,因为单一监管机构目前通常对加密货币资产实体的活动没有全面的了解。[2022/12/19 21:52:39]

图片来自HuggingfaceCTO推特

在现在巨头林立的人工智能战场上,HuggingFace就像是一支强有力的民间力量。当巨头们都在努力保持自己生成式AI的霸主地位的时候,HuggingFace的目标则是寻找各种途径来保持AI研究空间的开放。

而这样特点也让HuggingFace目前颇有一些“中立”的色彩。无论微软、谷歌、亚马逊、Meta这些大公司打得再激烈,但它们几乎全都是HuggingFace的支持者。

那么,HuggingFace究竟是如何发展起来的,它具体做着什么样的业务?

02一次歪打正着的创业,造就AI界的顶流“笑脸”

在普通人的眼中,人工智能一向都属于“冷感”很强的技术领域,无论是充斥着大量数字、模型的算法,还是由各种机械零件组装成的机器人,都不免让人感到有些距离感。但作为专为人工智能开发者服务的HuggingFace却主打了一个反差萌,笑脸Emoji再加上一双摊开的小手,logo甚至有点过份可爱。

加密借贷平台Vauld申请将债权人保护延长至2023年3月7日:金色财经报道,根据法庭文件,亚洲加密借贷平台Vauld向新加坡法院申请将债权人保护延长至2023年3月7日,以寻求更多时间来解决其财务问题,Vauld现有的债权人保护将于11月7日到期。根据法庭文件,本月早些时候Vauld成立了一个债权人委员会,该委员会由17名未披露的Vauld债权人组成。

此前报道,Vauld于7月份暂停客户提款,欠债权人4.02亿美元,其中3.63亿美元(或90%)来自个人散户投资者的存款。(The Block)[2022/10/22 16:35:00]

之所以有这样一个可爱的logo,是因为一开始HuggingFace做的产品其实是一款针对青少年群体的聊天机器人。

当时HuggingFace的想法是基于自然语言处理(NLP)的人工智能技术,来为年轻人们开发一个带有娱乐性、类似于电子宠物一样的个性化聊天机器人,让大家可以在无聊的时候跟它聊八卦、问它问题、让它生成一些有趣的图片之类的事情。

这种新颖的人机社交模式得到了一些关注。2017年3月9号,HuggingFaceApp在iOSAppStore正式推出,并拿到了包括SVAngel、NBA球星杜兰特在内的120万美元的天使投资。此后一年多,HuggingFace都一直围绕着自己的聊天机器人业务在做着自然语言理解的相关训练并发布相关的产品,高峰时期每天处理的消息数量达到了1百万条。在2018年5月,它又获得了400万美元的种子轮融资。

Michael Saylor:希望马斯克多买一些比特币:金色财经报道,Michael Saylor在社交媒体回复马斯克时表示:“我们更希望你多买一些比特币”。

此前消息,马斯克在社交媒体上表示收购曼联,但随后澄清,收购曼联系推特上的一个旧梗,不会购买任何球队。[2022/8/18 12:32:21]

HuggingFace聊天软件界面

虽然发展的还算不错,但由于当时的人工智能的理解能力和聊天水平远不及ChatGPT这样智能有趣,再加上并非刚需的业务场景,HuggingFace的规模一直都难以扩大。

但为了开发这个聊天机器人,HuggingFace的团队做了一个很重要的事,那就是构建了一个底层库来容纳各种机器学习模型和各种类型的数据集。包括帮助训练聊天机器人检测文本消息情绪、生成连贯的响应、理解不同对话主题等,并且在GitHub上始终以开源项目的形式持续发布该底层库的一些内容。

就这样不温不火地发展了一段时间后,2018年底,HuggingFace迎来了一个重要的转折。

当年11月,谷歌宣布推出基于双向Transformer的大规模预训练语言模型BERT,瞬间成为了自然语言理解领域最受开发者关注的模型。但一开始,Google只发布了BERT的TensorFlow版本,HuggingFace就想为啥没有Pytorch版本呢?于是HuggingFace创始人之一的ThomasWolf就用几天的时间完成并开源了PyTorch-BERT,但没想到,就是这么一个“无心插柳”的项目让HuggingFace一炮而红。

借着BERT的东风,HuggingFace的Pytorch-pretrained-BERT发布3个多月后,快速达成了在Github上5000+星标的成就,到了7月份其Star数量已经超过了1万,发展速度远超其他同类开源项目,在Github的AI项目领域里一飞冲天。

在这样的发展势头下,HuggingFace的产品战略开始发生了调整。他们将更多精力放到了开源模型的建设上,将Pytorch-pretrained-BERT项目正式命名为Transformers,同时支持Pytorch和Tensorflow2.0。

借助Transformers库,开发者可以快速使用BERT、GPT、XLNet、T5、DistilBERT等NLP大模型,并使用这些模型来完成文本分类、文本总结、文本生成、信息抽取、自动QA等任务,节省大量时间和计算资源,此后HuggingFace在人工智能开源领域的名气也越来越大。

HuggingFace在Github上的Star曲线,图片来自于LuxCapital

到了2019年12月,HuggingFace拿到了由LuxCapital领投的A轮融资,融资额也比上一轮上了一个量级达到了1500万美元。值得注意的是,从这一轮开始,HuggingFace的标签开始不再是聊天机器人,而是把AI开源业务放在了首位。这张可爱的笑脸emoji也开始被广大人工智能开发者们所熟知。

03朝着人工智能界的Github前进

在2019年底AllinAI开源之后,HuggingFace开始着手构建一套完整的开源产品矩阵。用HuggingFace自己的话来讲,他们所做的事情,就是要架起人工智能科研和应用的桥梁。

过去这些年,人工智能领域的科研和商业应用是相对独立的两个板块,科研部门的任务就是对前沿技术进行研究,搞模型、发论文,应用部门的人则是要将最新技术用到产品中探索商业变现。如何将科研成果进行系统性的整合成为开源产品,让开发者们能够很快上手去应用转化是长期困扰业界的一个问题。

HuggingFace之前歪打正着地摸到了这个痛点,接着开始认真向下挖掘。简单来说,HuggingFace就是承担了人工智能科研走向应用这个过程中几乎所有复杂、繁琐、细碎的工作,然后方便任何人工智能从业者都可以去便捷地使用这些研究模型和资源。

目前,除了头号产品Transformers之外,HuggingFace还建立了Tokenizers、Datasets、Accelerate等库,从模型到数据集、从托管平台到性能优化,以开源社区为载体,HuggingFace已建立起了完整的人工智能开发生态,涵盖了NLP、计算机视觉、语音、时间序列、生物学、强化学习等各个领域。

值得注意的是,HuggingFace并不是因为ChatGPT带火的。2022年5月,当市场的注意力都还停留在Web3、元宇宙之上时,HuggingFace拿到了有红杉、LuxCapital参与的1亿美元融资,让其估值一举突破了20亿美元。

HuggingFace的融资历史,图片来自于企查查

HuggingFace当前的目标是想成为人工智能领域的Github。其创始团队认为,只有将那些少数人掌握的技术推广给更多人使用,才能真正最大程度地推进整个行业的进步。而从商业的角度来说,HuggingFace认为赋能整个AI社区所可能产生的价值可能比一个专有的工具高出千倍,而只要将其中的1%变现就能够足以撑起一个高市值的公司,类似的例子包括MongoDB、Elastic等等。

除了蓬勃发展的开源社区,从2020年开始,HuggingFace也开始做面向企业的定制自然语言模型,其客户涵盖彭博社、高通、英特尔等各类大中小型公司,并推出了包括AutoTrain、InferenceAPI&Infinity、PrivateHub、ExpertSupport等针对不同开发者类型的产品。据报道显示,从2021年开始HuggingFace就一直处于正现金流的状态。

HuggingFace的的产品服务,图片来自于其官网

HuggingFace在当前的人工智能领域中能够以开源社区的模式异军突起,有一些偶然也有必然。首先,过去这些年,人工智能技术所取得的进步都是由全世界的科研和产业领域共同协作所推动的,它的技术基因里其实就带着开放,因此建立起一个平台来链接研究者和开发者顺应了行业发展的历史和趋势。

此外,HuggingFace通过完成大量的基础性工作,来帮助弥补在人工智能领域里长期存在的科学与生产之间的鸿沟,这是过去很多开源平台没有关注和做到的。

在此前的一个采访中HuggingFace的CEOClémentDelangue表示,机器学习技术仍然还处于早期发展阶段,开源社区的能力将是巨大的。他认为,在未来5到10年,我们一定还会看到更多开源机器学习公司的崛起。

巴比特园区开放合作啦!

中文推特:https://twitter.com/8BTC_OFFICIAL

英文推特:https://twitter.com/btcinchinaDiscord社区:https://discord.gg/defidao电报频道:https://t.me/Mute_8btc电报社区:https://t.me/news_8btc

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

银河链

BNB香港Web3小作文:香港成了币圈的望北港

币圈大体是人格分裂的。 很多人内心住着一个大闹天宫的孙大圣,偏偏诸仙看五指山压不住,都一本正经地劝你合规从良。问题是,合玉皇的规还是如来的规?我石头里出来的,照说也不该他俩管阿.

MATIC除了EIP-4844,坎昆升级还会包含哪些内容?

2023年4月20日,以太坊开发者齐聚一堂,召开第107次核心开发者共识电话会议(ACDC)。ACDC是一个双周会议系列,由以太坊基金会研究员DannyRyan主持,此次会议中,以太坊开发人员讨论对以太坊共识层(CL)方面的修改内容,

[0:31ms0-1:917ms