OpenAI发布全新视频生成模型Sora:可一口气生成60秒视频

发布时间:2024-06-06 19:47:07 浏览量:234次

OpenAI发布全新视频生成模型Sora:可一口气生成60秒视频

2023年4月,成立于纽约的Runway AI发布了一段用AI生成的视频,画质模糊卡顿、物体扭曲,同时仅有4秒长度。

四个月后,Runway将视频效果提升至4K超高清度,实现了镜头连贯稳定,视频长度也从4秒增至18秒,成为当时视频时长的“时长天花板”。

然而,2024年,OpenAI推出了全新的AI模型Sora,可以生成长达60秒的视频。

OpenAI官宣Sora。

据OpenAI官方发布的信息,Sora具有突破性的能力:可以一次性生成60秒视频、确保镜头前后一致性,同时提供超逼真的画质。

通过Sora的视频demo可以看出,只需输入包含“构成元素、环境、行为及发生顺序、视频风格”等关键因素的Prompt(提示词),就能生成不同风格的60秒高清视频。

例如,Sora可以生成包含人物和城市元素的视频场景。

Sora生成视频(原视频为60秒,文中截取20秒,画质受gif大小限制有所压缩)。图源:OpenAI

Sora还能生成动物和自然风光的视频。

Sora生成视频(画质受gif大小限制有所压缩)。图源:OpenAI

突破时长和逼真的瓶颈,Sora摸着DALL-E过河

以前,视频生成模型在保持画质的前提下,时长很难突破10秒,但Sora把时长突破到60秒,达到了一种全新的高度。

Sora采用了Diffusion模型与Transformer神经网络结合的技术,使其能够对视觉数据进行分块式地理解,无需传统标准化的预处理。

基于不同计算量生成的样本效果。图源:OpenAI

基于原始数据训练,Sora可以生成各种时长、分辨率和尺寸不同的视频,适应各种场景和设备的需求。

Sora生成不同尺寸下的同主题视频。图源:OpenAI

尽管Sora的视频质量较高,专家仍对其进行审慎看待。

OpenAI为Sora生成的视频配备了水印标记,以显示由AI生成,并正进行红队测试,只对少数人开放测试。

Sam Altman的推文。

Sora杀死Runway们,伦理安全引发大众担忧

一旦Sora突破了60秒时长瓶颈,画质达到商用级别,将对用户的生产和娱乐方式产生重大影响。

不过,视频深度伪造引发了专家对伦理安全问题的担忧,OpenAI为Sora添加水印以显示AI生成,以区分真实视频。

Sora生成的视频截图。提示词:打印一个人跑步的场景,35 毫米电影胶片。

OpenAI的Sora已经引起了视频模型创业者的注意,因为它的质量更好、时长更长、应用场景更广泛。

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定