0


2024年9月第2周AI资讯

阅读时间:3-4min

更新时间:2024.9.9-2024.9.13

Groq推出多模态大模型LLaVA v1.5 7B

概要

Groq 刚刚推出了LLaVA v1.5 7B,这是一种功能强大的新型多模态大模型,可以理解图像和文本,据称运行速度比 OpenAI 的 GPT-4o 快 4 倍。

详情

  • LLaVA v1.5 7B 可以回答有关图像的问题、生成字幕以及进行涉及文本、语音和图片的对话。
  • 该模型还可用于各种任务,例如视觉产品检查、库存管理以及为视障用户创建图像描述。
  • Groq目前免费提供此模型

推荐理由

Groq 今年早些时候因其极快的人工智能速度而走红,现在它将这些功能与强大的多模式模型结合起来。对于人工智能应用程序来说,越快越好,疯狂的速度与先进的模型相结合,为源源不断的新应用程序打开了大门。

链接

  1. Groq官方博客
  2. HuggingFace
  3. 开发者控制台

AI通过重读问题可以变得更聪明

概要

研究人员发现,让人工智能系统模仿人类行为,“重读”问题两次,可以显著提高他们在各种任务中的推理和解决问题的能力。

详情

  • 这项技术被称为 RE2(重读),通过在回答之前简单地重复问题,可以提高人工智能在数学、常识和符号推理方面的表现。
  • 它适用于不同的人工智能模型,并且可以与其他人工智能推理技术相结合。
  • 该方法在重复问题两次时最有效——重复次数越多,性能就会降低。
  • RE2 甚至改进了非指令微调的 AI 模型,显示出广泛的适用性。

推荐理由

RE2 为越来越多的研究增添了新内容,显示了模仿人类思维和处理方式来改进人工智能的潜力。这项研究的简单性还表明,许多人工智能公司在寻求最高性能模型的过程中可能忽视了基本的、受人类启发的提示技术。

链接

  1. 论文

美国Weave公司发布Isaac多功能个人机器人

美国Weave公司发布Isaac多功能个人机器人

概要

Isaac是一款多功能个人机器人,旨在帮助完成各种家务任务,将于 2025 年秋季向首批客户发货。

详情

  • Isaac可以自主整理、折叠衣物、整理空间以及执行许多其他家务。
  • 机器人管家可以响应语音或文本命令,并可以通过应用程序进行编程。
  • 出于隐私原因,Isaac随身携带的相机在不使用时可以折叠起来并存放在外壳中。
  • 售价:59,000 美元(或 48 个月每月 1,385 美元)以及 1,000 美元的预订费。

推荐理由

对价格实惠、智能的个人机器人助手的竞争正在持续升温(特斯拉的 Optimus、1X 的 NEO Beta、国产的AGIBOT ,Weave 的Isaac),看来到 2025 年我们将开始在家庭中看到这些机器人。

链接

官网


特斯拉电动汽车将实现无线充电

概要

特斯拉的一项新专利展示了其先进的无线充电系统,有可能解决电动汽车手动充电的需要——允许自动机器人出租车在无需人工干预的情况下充电。

详情

  • 该专利于二月份提交并于最近公布,重点介绍了一种使用智能技术来适应无线充电条件变化的系统。
  • 它提到了一个接地垫和一个车辆垫,它们一起工作,无需任何电线即可为汽车充电。
  • 充电站可以估计和调整线圈电感的变化,从而提高效率和安全性。
  • 特斯拉可能会在下个月即将举行的 Robotaxi 活动中推出这种无线充电技术,以契合该技术使自动驾驶车辆能够自动充电的潜力。

推荐理由

虽然电动汽车的无线充电并不能解决主要问题,但它可能会改变自动驾驶汽车的游戏规则。如果特斯拉的 Robotaxis 可以无线充电,它们就可以几乎无休止地自主运行,无需人工干预——这是保持出租车队 24/7 运行的一个重要功能。

链接

WIPO - Search International and National Patent Collections


Adobe开启视频编辑新时代

概要

Adobe展示了其 Firefly AI 视频模型,其中包括扩展现有视频以及根据文本或图像提示创建新剪辑的工具。

详情

  • 即将推出三个关键功能:文本到视频、图像到视频和生成扩展。
  • 文本到视频可以根据提示创建剪辑,并提供相机控制和参考图像的选项。
  • 图像到视频将静态图像或插图转换为真人剪辑。
  • Premiere Pro 测试版中的生成式扩展可以添加素材来覆盖间隙或扩展镜头。

推荐理由

Sora 专注于从头开始生成视频,Adobe 的目标是为视频编辑本身创造“一个新时代”。很快,任何人都将能够通过AI改变相机角度、扩展场景并立即生成幕后花絮。

链接

Bringing generative AI to video with Adobe Firefly Video Model | Adobe Blog


无人驾驶汽车超越人类

概要

Waymo 新碰撞数据的深入研究表明,无人驾驶汽车比人类驾驶的车辆安全得多,造成伤害的碰撞事故和每英里行驶安全气囊的部署次数更少。

详情

  • Waymo 车辆已行驶超过 2200 万英里,仅报告了 20 起造成伤害的事故。
  • 这个比率还不到类似条件下人类驾驶员预期的三分之一。
  • 在 23 起严重事故中,有 16 起涉及人类驾驶员追尾 Waymo 车辆。
  • Waymo 估计,其车辆发生碰撞而引发安全气囊展开的可能性是人类驾驶员的六分之一。

推荐理由

数据表明,我们现在拥有安全的自动驾驶汽车,并且这些人工智能驱动的汽车可以显着减少道路事故和伤害。

链接

Human drivers are to blame for most serious Waymo collisions


AI辅助设计的步行桌“Carpentopod”

概要

这是一款荷兰工程师打造的无线行走木制咖啡桌,采用AI优化设计的腿部结构。

详情

  • 该桌子有 12 个腿(每端 6 个),由精密切割的层压竹制成,由两个电机控制。
  • 腿部结构优化了行走速度、间隙和效率。
  • Carpentier 开发了一款定制电机控制软件,并使用经过改造控制器进行远程操作。

推荐理由

该项目展示了创客如何将AI、传统工艺和现代制造技术结合起来,将AI用于设计优化。

链接

Carpentopod: A walking table project

bilibili:荷兰工程师打造了AI辅助设计的步行桌“Carpentopod”


Mistral发布多模态大模型Pixtral 12B

概要

法国AI初创公司 Mistral发布了Pixtral 12B,这是他们的第一个能够处理图像和文本的多模态模型,可以免费下载。

详情

  • Pixtral 12B 是一个拥有 120 亿个参数的模型,大小约为 24GB,基于 Mistral 的文本模型 Nemo 12B 构建。
  • Pixtral 12B 是初创公司的第一个多模式模型,这意味着它可以处理和回答有关图像和文本的问题。
  • 它可以在 Apache 2.0 许可证下通过GitHub和Hugging Face下载,允许不受限制的使用和微调。
  • Mistral 计划很快在其聊天机器人和 API 平台 Le Chat 和 Le Plateforme 上提供 Pixtral 12B。

推荐理由

Mistral 凭借一支由顶尖研究人员组成的精干团队以及最近一轮 6.45 亿美元的融资,该公司正在通过强大的开放模型积极突破人工智能的界限。

链接

https://huggingface.co/mistral-community/pixtral-12b-240910?utm_source=www.therundown.ai&utm_medium=referral&utm_campaign=google-s-new-ai-turns-notes-into-podcasts

标签: 人工智能

本文转载自: https://blog.csdn.net/weixin_38369492/article/details/142061174
版权归原作者 MOLWH 所有, 如有侵权,请联系我们删除。

“2024年9月第2周AI资讯”的评论:

还没有评论