0


20240904 每日AI必读资讯

中国首个通用泛化机器人终于来了!清华校友打造中国版Figure 01,连续泛化丝滑处理多任务

  • 「千寻智能 Spirit AI」具身智能公司,首次展示出了强大的多任务连续泛化能力。

  • 幕后技术团队纷纷出自UC Berkeley、CMU、NTU、清华、北大、浙大、华为、腾讯、大疆、小米等国内外顶尖高校、企业。

  • 这个机器人,是真正由模型训练出来的

  • 据了解,截止目前除了Figure 01,国内似乎还没有第二家能做到这种级别的泛化能力,即使被百般刁难,都能完成任务。

  • 清华校友下场创业,才4个月就已融资近2亿。

🔗中国首个通用泛化机器人终于来了!

上海人工智能实验室发布智能数据提取工具MinerU

  • MinerU是全新智能数据提取工具,简化AI数据处理流程,提高数据提取质量。

  • 包含Magic-PDF和Magic-Doc两大部分,支持多模态PDF文档转化为Markdown,网页内容提取与格式转换。

  • 利用LayoutLMv3、YOLOv8、UniMERNet和PaddleOCR等模型实现高质量文档数据提取。

🔗https://modelscope.cn/studios/OpenDataLab/MinerU

Jina AI发布 Jina ColBERT v2: 一个多语言的晚期交互信息检索模型

  • 核心思想是先分别对查询和文档进行编码,然后在最后阶段才让它们“互动”或“对比”。

  • 文档的编码可以提前完成并存储起来,当有查询进来时,只需要进行简单而快速的对比,大大提高了搜索的速度。

🔗详细:https://xiaohu.ai/p/13075

🔗官方blog:https://jina.ai/news/jina-colbert-v2-multilingual-late-interaction-retriever-for-embedding-and-reranking/

🔗技术报告:https://arxiv.org/pdf/2408.16672

中国版 Sora!Minimax 推出一款基于DIT架构的 AI 视频工具:海螺视频

  • MiniMax推出多款多模态模型,包括语音模型、音乐模型和视频生成模型。

  • Minimax 也推出了自己基于DIT架构的 AI 视频工具:海螺视频。该模型(代号abab-video-1)在处理高动态、变化多的视频信息时表现尤为出色,同时保持高效的压缩率。

  • 能模拟现实世界物理规律,在生成复杂场景和高动作场景时表现出色

  • 支持多种视频风格,无论是3D电影大片场景、2D动画,还是中式风格、科幻风格或美漫风格,均能轻松驾驭。

  • 据悉abab-video-1目前已参考“视频生成模型的评测框架”V-Bench进行了评测,得分排名第一,比可灵和runway都高。

  • abab-video-1具有压缩率高、文本响应好、风格多样,支持原生高分辨率、高帧率视频等特点,媲美电影质感。

🔗在线体验:https://hailuoai.com/

🔗 MiniMax发布三款模型

Cursor开源平替来了!AI编程工具Melty让编程效率提升 10 倍

  • Melty是一款开源的AI代码编辑器,能够实时理解开发者的需求,帮助写出高质量的代码。

  • 创始团队在Y Combinator的支持下快速迭代,经过28天开发,Melty能自动编写一半的代码!

  • 它不仅提升编程效率,还能帮助你更好地理解代码变化。

🔗详情链接:Melty — open source AI code editor

标签: 人工智能

本文转载自: https://blog.csdn.net/m0_46163918/article/details/141867711
版权归原作者 程序员的店小二 所有, 如有侵权,请联系我们删除。

“20240904 每日AI必读资讯”的评论:

还没有评论