0


【GitHub项目推荐--AI 开源项目/涵盖 OCR、人脸检测、NLP、语音合成多方向】【转载】

今天为大家推荐一个相当牛逼的AI开源项目,当前 Star 3.4k,但是大胆预判,这个项目肯定要火,未来 Star 数应该可以到 10k 甚至 20k!

着急的,可以到 GitHub 直接去看源码

传送门:https://github.com/PaddlePaddle/PaddleHub

啥也不说,带着大家看一些项目Readme 截图

***1. ***先看简介

首先,“无需深度学习背景、无需数据与训练过程”,“共享人工智能时代红利”以及“全部模型开源下载,离线可运行”

我只能说,这个repo,绝对是伸手党福音!

继续看特性部分:

涵盖的模型数量,CV、NLP、Audio、Video四大品类全覆盖,覆盖足够丰富。使用方法:一键预测、一键服务化、十行代码迁移,技术门槛足够降低。

咱们继续往下看近期更新

从数量上看,目前总数已经超过了180个,基本上是每个月都保持10-20个更新,而且更新的速度应该是越来越快,这个已经感觉到很爽了啊

从质量上再看看呢,(前方动图高能预警!)

***2. ***文本识别

包含超轻量中英文OCR模型,高精度中英文、多语种德语、法语、日语、韩语OCR识别。

***3. ***人脸检测

包含人脸检测,口罩人脸检测,多种算法可选。

***4. ***图像编辑

4倍超分效果,多种超分算法可选。

黑白图片上色,可用于老旧照片修复,

图像超分辨率 黑白图片上色

5. 目标检测

包含行人检测、车辆检测,更有工业级超大规模预训练模型可选。

***6. ***关键点检测
包含单人、多人身体关键点检测、面部关键点检测、手部关键点检测。

***7. ***图像分割

包含效果卓越的人像抠图模型、ACE2P人体解析世界冠军模型。

***8. ***图像动漫化

包含宫崎骏、新海诚在内的多位漫画家风格迁移,多种算法可选。

***9. ***图像分类

包含动物分类、菜品分类、野生动物制品分类,多种算法可选。

***10. ***词法分析

效果优秀的中文分词、词性标注与命名实体识别的模型。

***11. ***文本生成

包含AI写诗、AI对联、AI情话、AI藏头诗,多种算法可选。

***12. ***句法分析

效果领先的中文句法分析模型。

***13. ***情感分析

支持中文的评论情感分析。

***14. ***文本审核

包含中文色情文本的审核,多种算法可选。

***15. ***语音合成

TTS语音合成算法,多种算法可选

输入:Life was like a box of chocolates, you never know what you're gonna get.

合成效果如下:

合成音效,逛逛GitHub,4秒

***16. ***视频分类

包含短视频分类,支持3000+标签种类,可输出TOP-K标签,多种算法可选。

举例:输入一段游泳的短视频,算法可以输出"游泳"结果。

以上动图中用到的预训练模型,****全部开源,离线可下载,免费使用!

到底应该怎么用呢?别着急,咱们往下看

别的不需要多说了,大家上github上点过star之后自己体验吧,

https://github.com/PaddlePaddle/PaddleHub

AI 图片编辑工具

看看下面的效果图,当你输入 “把向日葵换成玫瑰花”,AI 会自动把图片中的向日葵换成玫瑰花。好像哈利波特挥一挥魔杖,完成一次物体变换施法。

不知道这个 AI 技术能不能在娱乐场景落地。比如你去环球影城哈利波特园区,买一个魔杖,对着墙上的一幅画念咒,画就按照你的描述自动变换(瞎想的..)

开源地址:https://github.com/lllyasviel/style2paints

原文链接:

这个 AI 开源项目要火!涵盖 OCR、人脸检测、NLP、语音合成多方向


本文转载自: https://blog.csdn.net/j8267643/article/details/135587071
版权归原作者 旅之灵夫 所有, 如有侵权,请联系我们删除。

“【GitHub项目推荐--AI 开源项目/涵盖 OCR、人脸检测、NLP、语音合成多方向】【转载】”的评论:

还没有评论