Stable Diffusion 团队放大招！新绘画模型直出 AI 海报，像素级生成

来源：量子位

开源AI绘画扛把子，StableDiffusion背后公司StabilityAI再放大招！

全新开源模型DeepFloydIF，一下获星2千+并登上GitHub热门榜。

DeepFloydIF不光图像质量是照片级的，还解决了文生图的两大难题：

准确绘制文字。

Bitstamp创始人指控Bitstamp所有者迫使其低价出售剩余股份:8月23日消息，Bitstamp创始人 Nejc Kodri? 指控Bitstamp所有者NXMH 迫使其以低于市场价的价格出售剩余股份。这起诉讼于8月12日在英国高等法院提起。该诉讼涉及BitSTAMP7月21日行使的看涨期权，该期权将导致该公司以1346万美元收购Kodri?剩余的Bitstamp股份，他声称这一价格“远低于这些股票的现值”。（theblock）[2021/8/23 22:32:14]

以及准确理解空间关系。

网友表示，这可是个大事，之前想让Midjourneyv5在霓虹灯招牌上写个字AI都是瞎划拉两笔，对于镜子理解的也不对。

Gate.io 将于明日18:00开启Startup首发项目LOCG:据官方公告，Gate.io将于5月1日18:00至5月2日上午10:00 开启Startup首发 DAO SHO 项目 Legends of Crypto (LOCG)认购通道，16小时内有效下单同等对待。用户需要同意 DAO 锁仓 15 天。用户下单后到结束认购后2小时内，请务必保证现货交易账户中有不低于认购金额的足够金额，金额不足将自动排除在有效订单之外。

请务必注意：用户预计于5月3日前会获得代币。[2021/4/30 21:14:09]

使用DeepFloydIF，可以把指定文字巧妙放置在画面中任何地方。

Gate.io将于4月13日开启Startup项目RAZE:据官方公告，Gate.io将于4月13日12:00至4月13日18:00上线Startup项目Raze Network（RAZE）并开启认购通道，6小时内有效下单同等对待。用户参与认购时需要达到VIP1和以上级别。用户下单后到结束认购后2小时内，请务必保证现货交易账户中有不低于认购金额的足够金额，金额不足将自动排除在有效订单之外。

请务必注意，本次RAZE认购额度10万美金为Gate.io Labs参与Raze Network私募轮总额度，现提供给Gate.io社区用户参与Raze Network早期投资。[2021/4/8 19:59:01]

霓虹灯招牌、街头涂鸦、服饰、手绘插画，文字都会以合适的字体、风格、排版出现在合理的地方。

OSF将提供5000美元资助Stacks区块链生态系统建设:Stacks开放互联网基金会Stacks Open Internet Foundation（OSF）将提供5000美元赠款来建立Stacks区块链生态系统。据悉，该基金会是支持Blockstack的非营利组织。（Decrypt）[2020/9/4]

这意味着，AI直出商品渲染图、海报等实用工作流程又打通一环。

还在视频特效上开辟了新方向。

目前DeepFloydIF以非商用许可开源，不过团队解释这是暂时的，获得足够的用户反馈后将转向更宽松的协议。

动态 | 1000枚BTC转入Bitstamp交易所价值724.45万美元:Whale Alert数据监测，北京时间11月27日21:12, 1000枚BTC从Bitmex交易所转入Bitstamp交易所，按当前价格计算，价值约724.45万美元，交易哈希为：eeac02a2cd790cbfd67c719744db6fc8449b871a405ee3c840d7f1395b04a535。[2019/11/27]

有需求的小伙伴可以抓紧反馈起来了。

像素级图像生成

DeepFloydIF仍然基于扩散模型，但与之前的StableDiffusion相比有两大不同。

负责理解文字的部分从OpenAI的CLIP换成了谷歌T5-XXL，结合超分辨率模块中额外的注意力层，获得更准确的文本理解。

负责生成图像的部分从潜扩散模型换成了像素级扩散模型。

也就是扩散过程不再作用于表示图像编码的潜空间，而是直接作用于像素。

官方还提供了一组DeepFloydIF与其他AI绘画模型的直观对比。

可以看出，使用T5做文本理解的谷歌Parti和英伟达eDiff-1也都可以准确绘制文字，AI不会写字这事就是CLIP的锅。

不过英伟达eDiff-1不开源，谷歌的几个模型更是连个Demo都不给，DeepFloydIF就成了更实际的选择。

具体生成图像上DeepFloydIF与之前模型一致，语言模型理解文本后先生成64×64分辨率的小图，再经过不同层次的扩散模型和超分辨率模型放大。

在这种架构上，通过把指定图像缩小回64×64再使用新的提示词重新执行扩散，也实现以图生图并调整风格、内容和细节。

并且不需要对模型做微调就可直接实现。

另外，DeepFloydIF的优势还在于，IF-4.3B基础模型是目前扩散模型中U-Net部分有效参数是最多的。

在实验中，IF-4.3B取得了最好的FID分数，并达到SOTA。

谁是DeepFloyd

DeepFloydAIResearch是StabilityAI旗下的独立研发团队，深受摇滚乐队平克弗洛伊德影响，自称为一只“研发乐队”。

主要成员只有4人，从姓氏来看均为东欧背景。

这次除了开源代码外，团队在HuggingFace上还提供了DeepFloydIF模型的在线试玩。

我们也试了试，很可惜的是目前对中文还不太支持。

原因可能是其训练数据集LAION-A里面中文内容不多，不过既然开源了，相信在中文数据集上训练好的变体也不会太晚出现。

OneMoreThing

DeepFloydIF并不是StabilityAI昨晚在开源上的唯一动作

语言模型方面，他们也推出了首个开源并引入RLHF技术的聊天机器人StableVicuna，基于小羊驼Vicuna-13B模型实现。

目前代码和模型权重已开放下载。

完整的桌面和移动界面也即将发布。

DeepfloydIF在线试玩：

https://huggingface.co/spaces/DeepFloyd/IF

代码：

https://github.com/deep-floyd/IF

StableVicuna在线试玩：

https://huggingface.co/spaces/CarperAI/StableVicuna

权重下载：

https://huggingface.co/CarperAI/stable-vicuna-13b-delta

参考链接：

https://deepfloyd.ai/deepfloyd-if

https://stability.ai/blog/deepfloyd-if-text-to-image-model

https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

https://stable-diffusion-art.com/how-stable-diffusion-work/

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

欧易okex官网別被大佬給騙了誰說香港可以隨便發幣了？

1900/1/1 0:00:00

最近香港Web3.0大热,热到让部分不太关注区块链行业的朋友都开始有点蠢蠢欲动。按理说春末夏初,你稍微动下是可以的,但如果动的太多,可就容易扯淡了.

波场明星项目周报 | Sui测试网峰值TPS达到297000；OpenSea估值降至30亿美元（4.24-4.30）

1900/1/1 0:00:00

4月24日-4月30日当周,比较值得关注的动态如下：Sui?性能更新：测试网最终确定时间约为?480?毫秒；TigerGlobal?将?OpenSea?估值下调至?30?亿美元；Solana?推出?100?万美元?AI?基金.

币安交易所app下载项目跑路也能保证资金安全？体验一下 zkLink 资金灾难逃离测试

1900/1/1 0:00:00

来源：zkLink社区加密世界经常被形容为黑暗森林,这是一个充满机遇,但也危险重重的新大陆。黑客攻击和程序漏洞时刻威胁着用户资金安全,更有甚者,项目卷款跑路的事情也时有发生,大大提高用户筛选项目的成本.

ADA隐私保护技术TEE与ZKP的区别究竟在哪里？4个维度帮你全面了解

1900/1/1 0:00:00

区块链通过数十个为全球数百万用户提供服务的开放和无需许可的网络,为互联网提供了一种完全透明的方法。然而,透明度虽然提供了许多好处,但它必须与强大的隐私工具相平衡,这些工具可以加强每个链上用户的机密性和数据安全性.

银河链

Stable Diffusion 团队放大招！新绘画模型直出 AI 海报，像素级生成

银河链