0


每周编辑精选|7×24h 的 AI 直播间来啦!一键使用 GPT-SoVITS 声音克隆教程上新

📢📢 好消息!好消息!📺「超神经电视台」在 bilibili 上线啦~

「超神经电视台」会「7×24h」不间断直播 AI 领域的实用课程与行业大会等, 每周我们会在文章结尾发布下周的节目预告哦!

点开看看:http://live.bilibili.com/26483094

悄悄说,前段时间从 OpenAI 离职的技术大神 Karpathy发布的 AI 大课——「让我们构建 GPT Tokenizer(分词器)」将会在下周五(3 月 15 日)晚上 8 点在直播间播放。 为了让大家更方便地体验该项目,项目相关资源 minbpe 也已上线至 hyper.ai 官网,快来观看学习吧~

此外,本周 hyper.ai 官网还上线了多个文本类情感分析数据集供大家下载使用哦!

3 月 4 日-3 月 8 日,hyper.ai 官网更新速览:

  • 优质公共数据集:10 个
  • 社区文章精选:4 篇
  • 热门百科词条:10 条

访问官网:hyper.ai

公开数据集精选

1. minbpe 存储库

该存储库为 Karpathy 的 minbpe 项目存储库,包含了基于类的 Tokenizer 实现,如 BaseTokenizer 和 BasicTokenizer 等。这些类的设计旨在提供训练、编码和解码的基本功能,以及保存和加载等实用功能。

直接使用:

https://reurl.cc/97A8QY

2. D4 面向抑郁症诊断聊天的中文对话数据集

D4 是一个抑郁症诊断聊天中文对话数据集。它是一种被称为任务型聊天的全新对话类型。该数据集由 1,339 个多轮对话组成,包含对话摘要和诊断结果。

直接使用:

https://reurl.cc/krbAk3

3. dmsc_v2 电影评论数据集

该数据集包含超 70 万用户对 28 部电影的超 200 万条评分或评论数据。适用于推荐系统、情感/观点/评论等倾向性分析的任务。

直接使用:

https://reurl.cc/prbEOl

4. Amazon 亚马逊用户评价数据集

该数据集包含 142 万用户对亚马逊上 1,100 多个类目 52 万件商品的 720 万条评论或评分数据,可用于推荐系统、情感/观点/评论倾向性分析等任务。

直接使用:

https://reurl.cc/97A8AV

5. Dianping 大众点评数据集

该数据集包含 54 万用户对 24 万家餐馆的 440 万条评论或评分数据。可用于推荐系统、情感/观点/评论倾向性分析等任务。

直接使用:

https://reurl.cc/eLbYrR

6. Weibo_senti_100k 新浪情感类微博数据集

该数据集包含 10 万多条带情感标注的新浪微博,其中正负向评论各约 5 万条。

直接使用:

https://reurl.cc/N487a6

7. Online_shopping_10_cats 10 个种类的线上购物评论数据集

该数据集包含 10 个类别(书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服、计算机、酒店)的线上购物评论,共 6 万多条的评论数据,正、负向评论各约 3 万条。可用于情感/观点/评论等倾向性分析任务。

直接使用:

https://reurl.cc/qrbl8g

8. ChnSentiCorp 携程酒店评价数据集

该数据集包含来自携程网的 7,000 多条酒店评论数据,5,000 多条正向评论和 2,000 多条负向评论。

直接使用:

https://reurl.cc/QelvjM

9. Waimai_10k 外卖平台用户评价数据集

该数据集来自某外卖平台收集的用户评价,包含正向评价约 4,000 条,负向评价约 8,000 条。可用于情感/观点/评论的倾向性分析。

直接使用:

https://reurl.cc/K4zaQq

10. Four-shapes 四种形状数据集

该数据集包含 16,000 张 4 种形状的图像:正方形、星形、圆形和三角形。每个图像为 200×200 像素。数据是使用 Garmin Virb 1080p 运动相机收集的。

直接使用:

https://reurl.cc/E4N9Zm

更多本周更新数据集,请访问****:

https://hyper.ai/datasets

社区文章精选

  1. 准确率达 91.74%!东南大学提出光伏电池缺陷检测模型,首次引入神经结构搜索

为了同时满足工业领域对缺陷检测的精度和速度要求,来自东南大学自动化学院的张金霞教授团队,基于神经结构搜索和知识蒸馏,提出了一种光伏电池电致发光图像缺陷自动检测模型,准确率达 91.74%。目前,该研究成果已发布在 arXiv 上。

查看完整报道:

https://reurl.cc/97AK7x

  1. 内含教程丨音色克隆模型 GPT-SoVITS,5 秒语音就能克隆出相似度 95% 的声音

RVC (Retrieval based Voice Conversion) 创始人(GitHub 账号:RVC-Boss)开源了一款音色克隆项目 GPT-SoVITS,上线后便获得极高热度。仅需提供 5 秒语音样本,便可收获相似度达到 80%~95% 的克隆语音。目前,该模型部署教程已上线 HyperAI超神经官网。

点击开始克隆:

https://reurl.cc/97AKj8

  1. 两会进行时丨科技大佬点名 AI4S/人才培养/算力/大模型/行业通用数据集……

又是一年「两会」时!政府工作报告中明确提出要开展「人工智能+」行动,来自社会各界的人大代表与政协委员也纷纷围绕 AI 建言献策。本文梳理了部分科技圈大佬的提案建议。

查看完整报道:

https://reurl.cc/lgbxGE

  1. HyperAI 超神经 x DT 新材料丨 AI 技术在化学与材料科学科研中应用研讨会开启报名

「AI 技术在化学与材料科学科研中应用研讨会」将于 4 月 23 日—25 日在河南郑州开幕,多位行业专家将围绕 AI 应用于材料化学领域的挑战、前景与机遇等方面带来深度分享。

感兴趣的开发者们可以点击下方链接报名。

报名链接:

https://reurl.cc/QelMdb

热门百科词条精选

1. 拉普拉斯算子 Laplacian

2. 世界模型 World Modeling

3. 每秒帧数 Frames Per Second (FPS)

4. 扩散模型 Diffusion Model**

5. 人机回圈 Human-in-the-loop (HITL)

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://hyper.ai/wiki

超神经 B 站直播预告
日期时间内容3 月 11 日 星期一10:00英伟达历年发布会3 月 12 日 星期二10:00 18:00机器学习编译课程特斯拉 AI 日3 月 13 日星期三10:00谷歌历年 I-O 发布会3 月 14 日 星期四10:00斯坦福HAI 研讨会3 月 15 日 星期五10:00 20:00MIT 深度学习课程Let‘s build GPT Tokenizer3 月 16 日 星期六10:00哈佛 CS50 课程(2023)3 月 17 日 星期日10:00哈佛 CS50 课程(2022)
超神经电视台 7×24h 不间断直播,点击即可收获 AI 领域的「电子榨菜」:

http://live.bilibili.com/26483094


以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区, 致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1200+ 公开数据集提供国内加速下载节点
  • 收录 300+ 经典及流行在线教程
  • 解读 100+ AI4Science 论文案例
  • 支持 500+ 相关词条查询
  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai/


本文转载自: https://blog.csdn.net/HyperAI/article/details/136559578
版权归原作者 HyperAI超神经 所有, 如有侵权,请联系我们删除。

“每周编辑精选|7×24h 的 AI 直播间来啦!一键使用 GPT-SoVITS 声音克隆教程上新”的评论:

还没有评论