中国首个通用泛化机器人终于来了!清华校友打造中国版Figure 01,连续泛化丝滑处理多任务
「千寻智能 Spirit AI」具身智能公司,首次展示出了强大的多任务连续泛化能力。
幕后技术团队纷纷出自UC Berkeley、CMU、NTU、清华、北大、浙大、华为、腾讯、大疆、小米等国内外顶尖高校、企业。
这个机器人,是真正由模型训练出来的
据了解,截止目前除了Figure 01,国内似乎还没有第二家能做到这种级别的泛化能力,即使被百般刁难,都能完成任务。
清华校友下场创业,才4个月就已融资近2亿。
🔗中国首个通用泛化机器人终于来了!
上海人工智能实验室发布智能数据提取工具MinerU
MinerU是全新智能数据提取工具,简化AI数据处理流程,提高数据提取质量。
包含Magic-PDF和Magic-Doc两大部分,支持多模态PDF文档转化为Markdown,网页内容提取与格式转换。
利用LayoutLMv3、YOLOv8、UniMERNet和PaddleOCR等模型实现高质量文档数据提取。
🔗https://modelscope.cn/studios/OpenDataLab/MinerU
Jina AI发布 Jina ColBERT v2: 一个多语言的晚期交互信息检索模型
核心思想是先分别对查询和文档进行编码,然后在最后阶段才让它们“互动”或“对比”。
文档的编码可以提前完成并存储起来,当有查询进来时,只需要进行简单而快速的对比,大大提高了搜索的速度。
🔗技术报告:https://arxiv.org/pdf/2408.16672
中国版 Sora!Minimax 推出一款基于DIT架构的 AI 视频工具:海螺视频
MiniMax推出多款多模态模型,包括语音模型、音乐模型和视频生成模型。
Minimax 也推出了自己基于DIT架构的 AI 视频工具:海螺视频。该模型(代号abab-video-1)在处理高动态、变化多的视频信息时表现尤为出色,同时保持高效的压缩率。
能模拟现实世界物理规律,在生成复杂场景和高动作场景时表现出色
支持多种视频风格,无论是3D电影大片场景、2D动画,还是中式风格、科幻风格或美漫风格,均能轻松驾驭。
据悉abab-video-1目前已参考“视频生成模型的评测框架”V-Bench进行了评测,得分排名第一,比可灵和runway都高。
abab-video-1具有压缩率高、文本响应好、风格多样,支持原生高分辨率、高帧率视频等特点,媲美电影质感。
🔗在线体验:https://hailuoai.com/
🔗 MiniMax发布三款模型
Cursor开源平替来了!AI编程工具Melty让编程效率提升 10 倍
Melty是一款开源的AI代码编辑器,能够实时理解开发者的需求,帮助写出高质量的代码。
创始团队在Y Combinator的支持下快速迭代,经过28天开发,Melty能自动编写一半的代码!
它不仅提升编程效率,还能帮助你更好地理解代码变化。
🔗详情链接:Melty — open source AI code editor
版权归原作者 程序员的店小二 所有, 如有侵权,请联系我们删除。