Sora OpenAI发布的人工智能文生视频大模型

文章目录

前言

Sora，OpenAI发布的人工智能文生视频大模型（但OpenAI并未单纯将其视为视频模型，而是作为“世界模拟器”），于2024年2月15日（美国当地时间）正式对外发布。
Sora继承了DALL-E 3的画质和遵循指令能力，可以根据用户的文本提示创建逼真的视频，该模型可以深度模拟真实物理世界，能生成具有多个角色、包含特定运动的复杂场景，能理解用户在提示中提出的要求，还了解这些物体在物理世界中的存在方式。
Sora对于需要制作视频的艺术家、电影制片人或学生带来无限可能，其是OpenAI“教AI理解和模拟运动中的物理世界”计划的其中一步，也标志着人工智能在理解真实世界场景并与之互动的能力方面实现飞跃

一、Sora是什么？

OpenAI首个视频生成模型.

二、功能特色

功能综述

Sora可以快速制作最长一分钟、准确反映用户提示、可一镜到底的视频 [2]（其他AI视频工具还在突破几秒内的连贯性 [23]），视频可以呈现“具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场景” [1]。

静态图生成视频

Sora还具备根据静态图像生成视频的能力，能够让图像内容动起来，并关注细节部分，使得生成的视频更加生动逼真，这一功能在动画制作、广告设计等领域具有应用前景 [3-4]。

视频扩展与缺失帧填充

Sora能够获取现有视频并对其进行扩展或填充缺失的帧，这一功能在视频编辑、电影特效等领域具有应用前景，可以帮助用户快速完成视频内容的补充和完善 [3-4]。

连接视频

可以使用Sora连接两个输入视频，在具有完全不同主题和场景组成的视频之间实现无缝过渡 [3]。

其他能力

Sora的其他能力

图像生成
Sora可以生成各种尺寸的图像，分辨率最高达2048×2048 。

3D一致
Sora可以生成动态运动的视频，随着相机的移动和旋转，人和场景元素在三维空间中一致移动。

远距离连贯性
物体持久性
Sora通常能够有效地对短期和长期依赖关系进行建模，包括人、动物和物体的持久化，即使它们被遮挡或离开框架。同时，它还能在单个样本中生成同一角色的多个镜头，以保持其在整个视频中的外观

互动性
Sora有时可以用简单的方式模拟影响世界状态的动作。例如一个画家可以在画布上留下新的笔触，并随着时间的推移而持续，或者一个男人可以吃汉堡并留下咬痕。

模拟数字世界
Sora可以模拟人工过程，例如电子游戏，并能够通过基本策略控制玩家，同时高保真地渲染世界及其动态。

Sora引爆国内外科技圈

AI想象中的龙年春节，红旗招展人山人海

在这里插入图片描述
雨后东京街头，潮湿地面反射霓虹灯光影效果堪比RTX ON。

在这里插入图片描述

奥特曼在线接单

目前已有一些视觉艺术家、设计师和电影制作人（以及OpenAI员工）获得了Sora访问权限。
他们开始不断po出新的作品，奥特曼也开始了在线接单模式。
带上你的提示词@sama，就有可能收到生成好的视频回复。

传送门（）->：Sora

标签：人工智能计算机视觉

本文转载自: https://blog.csdn.net/weixin_43707759/article/details/136139560
版权归原作者 steamone 所有，如有侵权，请联系我们删除。