最近 AI 绘画火的一塌糊涂,你输一句话 AI 自动把你描述的场景画出来。本文盘点 GitHub 上几个较火的 AI 绘画开源项目。
本期推荐开源项目目录:
Latent Diffusion
PI-REC
Disco Diffusion
DALLE
01
Latent Diffusion
Stable Diffusion 是 Stability AI 和 Runway 合作的研究成果,基于计算机视觉顶会 CVPR 2022 的一篇论文《High-Resolution Image Synthesis with Latent Diffusion Models》。
根据官方的描述,Stable Diffusion 仅仅需要几秒就能根据文本生成高分辨的图像。
开源地址1:https://github.com/CompVis/stable-diffusion
开源地址2:https://github.com/CompVis/latent-diffusion
02
PI-REC
这个开源项目不是根据文字生成图片描述,但是也非常有趣。你画一幅肖像画的时候需要怎么做?
一般先勾勒出轮廓,然后再给轮廓中的区域上色,比如头发是黑的,眼睛是黑的,脸是黄色的。当完成了轮廓的勾勒和上色,也基本完成了一副肖像画。
基于这个想法,PI-REC 模拟了人画画的过程,使用 PI-REC 时 你只需要勾勒轮廓+上色,AI 就根据你画的轮廓和上色的结果生成一张高清的肖像画。
开源项目:https://github.com/youyuge34/PI-REC#jump_zh
03
Disco Diffusion
这个开源项目也推荐过一次,文本生成图像的效果堪称 Bug 级别,并且提供了 Notebook 方便你快速体验。
开源地址:https://github.com/alembics/disco-diffusion
来看几个实例,比如输入:一座奇异的灯塔,灯的光照在汹涌的血海中
输入:一个美丽的建筑伫立在宁静的风景中
输入:坏情绪教堂
输入:鲸鱼之家
输入:机器人在守卫秘密的实验室
04
DALLE
本开源项目基于论文《Zero-Shot Text-to-Image Generation》,也是一个使用文本来生成图片的开源项目。来看看这个开源项目的效果:
输入:坏情绪教堂
输入:机器人在守卫秘密的实验室
输入:一座奇异的灯塔,灯的光照在汹涌的血海中
输入:鲸鱼之家
开源地址1:https://github.com/lucidrains/DALLE2-pytorch
开源地址2:https://github.com/openai/DALL-E
开源地址3:https://github.com/borisdayma/dalle-mini
历史盘点
逛逛 GitHub 每天推荐一个好玩有趣的开源项目。历史推荐的开源项目已经收录到 GitHub 项目,欢迎 Star:
https://github.com/Wechat-ggGitHub/Awesome-GitHub-Repo
推荐阅读
*1. *GitHub 上有什么好玩的项目?
2. 推荐一款高颜值网易云播放器
*3. *基于 Spring Boot 的百度云高仿项目
*4. *盘点百度 4 个牛逼哄哄的开源项目
版权归原作者 逛逛GitHub 所有, 如有侵权,请联系我们删除。