overfit同步小助手

2024-10-09 08:02:19

20240920 每日AI必读资讯

** 阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4**

Qwen2.5系列模型开源，包括通用语言模型和专业领域模型，提升知识获取、编程和数学能力。
模型支持长文本处理，生成最多8K tokens内容，对29种以上语言提供支持。
Qwen2-VL-72B模型取得显著改进，在指令执行、长文本生成、数据理解和结构化输出方面表现优异。

🔗详情链接：https://modelscope.cn/studios/qwen/Qwen2.5

🔗 新SOTA来了：国产9B模型多项得分超4o-mini，中国出海电商已经用上了-CSDN博客

**Luma AI 推出 Dream Machine API **

开发者可将AI视频生成能力无缝集成到自己的产品中

无需掌握复杂的提示工程，用户可以通过简单的文本指令生成视频。

Dream Machine API 提供直观的系统来创建和编辑视频，用户无需在应用中构建复杂的工具，也不需要切换到其他视频编辑器。

🔗在线体验：https://huggingface.co/spaces/akhaliq/dream-machine

🔗详细：https://xiaohu.ai/p/13752

YouTubeVeo 引入Google DeepMind 的 Veo 模型****！为创作者想象插上翅膀

创作者可使用Veo创作视频
这些AI技术将集成到YouTube Shorts 的 Dream Screen 功能中。
Dream Screen 首先使用 Imagen 3 生成四个不同的图像，创作者可以从这些选项中选择符合他们偏好风格、构图或美学的图像。
选择图像后，然后Veo模型将基于所选图像生成6秒长的高质量背景视频，以实现用户的创意愿景。

🔗 YouTubeVeo 引入Google DeepMind 的 Veo 模型创作者可使用Veo创作视频 – XiaoHu.AI学院

腾讯出品！AI音频模型 EzAudio AI，让文本秒变逼真声音

EzAudio 是由约翰霍普金斯大学与腾讯合作推出的新型文本转音频生成模型，标志着音频技术的一次重大进步。
该模型通过创新的架构和技术，生成的音频样本在质量上优于现有开源模型，具备广泛的应用潜力。
随着技术的发展，伦理和责任使用的问题逐渐突显，EzAudio 的公开研究代码也为未来的风险与收益提供了广泛的检验机会。

🔗详情链接：:https://huggingface.co/spaces/OpenSound/EzAudio

2024AI智能体应用洞察半年报：AI类APP月活超6600万

AI类应用月活跃用户数超过6600万，展示AI技术快速发展和普及。
AI应用形成八大玩法门类，商业化路径开启。
智能体服务解决用户需求，微信生态重要渠道，商业模式探索中。

标签：人工智能

本文转载自: https://blog.csdn.net/m0_46163918/article/details/142364650
版权归原作者 程序员的店小二 所有，如有侵权，请联系我们删除。

发表评论

登录后发布评论

“20240920 每日AI必读资讯”的评论:

还没有评论

关于作者

overfit同步小助手

文章同步

相关阅读

网络安全法-网络运行安全

使用selenium/drissionpage时如何阻止chrome自动跳转http到https

docker desktop 里部署的Open WebUI 管理员密码忘记了的处理方法

在ubuntu20.04中搭建onsite比赛运行环境

利用开源的低代码表单设计器FcDesigner高效管理和渲染复杂表单结构

Kafka学习笔记

【前端】浏览器输入url到页面呈现发生了什么？

文章导航