文生成视频模型Sora及其9大功能

发布时间:2024-03-28 13:19:45 浏览量:194次

  1. Sora简介

2024年2月15日,OpenAI发布了人工智能文生视频大模型Sora,并将Sora作为世界模拟器面世。Sora是OpenAI“教AI理解和模拟运动中的物理世界”计划中的一环,其诞生标志着人工智能在理解真实世界场景并与之互动的能力方面实现了飞跃。

OpenAI发布Sora

Sora继承了DALL-E 3的画质和遵循指令能力,可以根据用户的文本提示创建逼真的视频。Sora模型可以深度模拟真实物理世界,能生成具有多个角色、包含特定运动的复杂场景,能理解用户在提示中提出的要求,还了解这些物体在物理世界中的存在方式。


2. Sora功能特色

Sora具有“文本生成视频、静态图生成视频、视频拓展与缺失帧填充、连接视频”4大特色功能,除此之外还有5大功能,分别是:图像生成、3D一致、远距离连贯性物体持久性、互动性、模拟数字世界。

人工智能

2.1 特色功能

1. 文本生成视频

Sora可以快速制作最长一分钟、准确反映用户提示、可一镜到底的视频(其他AI视频工具还在突破几秒内的连贯性),视频可以呈现“具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场景”。

2. 静态图生成视频

Sora还具备根据静态图像生成视频的能力,能够让图像内容动起来,并关注细节部分,使得生成的视频更加生动逼真,这一功能在动画制作、广告设计等领域具有应用前景。

3. 视频扩展与缺失帧填充

Sora能够获取现有视频并对其进行扩展或填充缺失的帧,这一功能在视频编辑、电影特效等领域具有应用前景,可以帮助用户快速完成视频内容的补充和完善。

4. 连接视频

可以使用Sora连接两个输入视频,在具有完全不同主题和场景组成的视频之间实现无缝过渡。


2.2 其它功能

1. 图像生成

Sora可以生成各种尺寸的图像,分辨率最高达2048×2048。

2. 3D一致

Sora可以生成动态运动的视频,随着相机的移动和旋转,人和场景元素在三维空间中一致移动。

3. 远距离连贯性物体持久性

Sora通常能够有效地对短期和长期依赖关系进行建模,包括人、动物和物体的持久化,即使它们被遮挡或离开框架。同时,它还能在单个样本中生成同一角色的多个镜头,以保持其在整个视频的外观。

4. 互动性

Sora有时可以用简单的方式模拟影响世界状态的动作。例如一个画家可以在画布上留下新的笔触,并随着时间的推移而持续,或者一个男人可以吃汉堡并留下咬痕。

5. 模拟数字世界

Sora可以模拟人工过程,例如电子游戏,并能够通过基本策略控制玩家,同时高保真地渲染世界及其动态。


#人工智能#

#openai#

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定