Sora爆火,将会带来哪些投资机会?

发布时间:2024-04-09 12:18:24 浏览量:115次


Sora横空出世,引爆网络

2 月 16 日,美国人工智能公司 OpenAI 发布最新“文生视频”大模型 Sora,只需输入描述性句子即可创建逼真的视频.

并同时公布了一系列样片,展现了 Sora 令人惊叹的视频生成效果。同时,在部分样片中,Sora 还展现了对“物理规律”超强的学习能力,无论是飘逸的毛发还是水体波纹,Sora 都能“合乎常理”地呈现出来。


Sora究竟是什么?

Sora这一名称源于日文“空”,即天空之意,以示其无限的创造潜力。美国人工智能研究公司OpenAI发布的人工智能文生视频大模型。该模型可根据输入的文字信息生成时长一分钟的高保真的视频。

OpenAI 声称,如果给定一段简短或详细的描述或一张静态图片,Sora 就能生成类似电影的1080p 场景,其中包含多个角色、不同类型的动作和背景细节。

下图为模型通过文本信息:“一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。”

SORA有何特点与优势?

视频生成长达 1 分钟,大幅领先其他 AI 模型。

目前文本视频生成热门模型中,pika 1.0 默认生成 3 秒视频,可拓展到 7 秒;而 runaway gen2 模型最高可生成 18秒视频。不同于此前发布的模型只能生成几秒到十几秒长度的视频,Sora可以通过文本指令直接输出长达 60 秒的视频,并保持视频主体与背景的高度流畅性与稳定性。

Sora相对生成视频更真实,更逼真

首先Sora 模型可根据提示生成具有多个不同运动轨迹的角色的复杂场景视频,使得视频中的角色运动轨迹符合现实世界中的运行规律。

同时在单个样本中生成同一角色的多个镜头,实现各种中、近、远景的切换,并在整个视频中稳定保持其外观。此外Sora 可以生成摄像机动态运动的视频。

Sora 可以向前向后拓展视频,连接视频。 可以使用 Sora 在两个输入视频之间逐渐插值,在具有完全不同主题和场景构图的视频之间创建无缝过渡。

在长场景视频生成方面,Sora 的细节丰富度和画面流畅度显著高于其他视频生成模型。

克服了AI视频的技术难题

AI 视频生成面临的一个重大挑战是在较长的视频中保持人或物的一致。Sora 在大多数情况下能够有效地处理这些问题例如,Sora 可以保存人物、动物和物体,即使其被遮挡或暂时离开了镜头。Sora 也可以在单个视频中生成同一角色的多个镜头,并在整个视频中保持其外观的一致。

简而言之,SORA可以构建模拟数字世界和实现模拟世界与现实世界的互动,使得AI所生成的视频内容更具逼真,更具真实性。

可不断训练提升视频样本质量

Sora 使用扩散模型和 transform er的结合,使得视频生成质量随着训练计算的增加而显著提高。Sora 团队发现,随着Sora模型训练计算量越大,样本质量的提升越显著。

SORA对何种行业带来机遇?

短视频、传媒行业

传统视频制作往往需要投入大量人力、物力和时间成本,通过利用 Sora模型,创作者可以快速、高效地生成视频,极大降低产出成本。另一方面,Sora 的编辑和扩展能力为创作者的灵活创作提供了空间,将进一步提高内容产出的创新性和多样性。

当前,短视频时长主要集中在 60 秒及以下;中视频时长介于60 秒到 30 分钟之间;长视频包括时长 30 分钟及以上的所有视频。Sora 模型的内容产出能力恰好适配短视频的核心时长,短期内短视频的产能有望迅速增长。

综合来看,AI 视频可以大幅度降低视频的制作成本,对广告营销、影视、游戏等都有可观的降本增效作用,随着 AI 视频工具的不断更新迭代,相关产业制作效率或将实现质的提升,游戏、短视频等相关内容的供给端有望实现飞跃式的发展。

AI大模型与运用

随着文生图、图片对话技术的成熟,文生视频可能成为多模态大模型下一步发展的方向。该技术有望极大降低短剧制作的成本,并且会进一步向影视、自媒体、游戏等领域渗透,提高视频创作效率。

此外Sora 展示了 AI 在理解和模拟物理世界方面的能力,这被认为是实现通用人工智能(AGI)的关键一步(AGI 是指能够在多种任务和环境中灵活应用知识的 AI)。

随着 AI 文生视频技术的不断完善和更新,我们认为 AI 视频有望凭借人工智能的技术优势和视频这一品类的内容优势打开市场。随着下游客户对 AI 需求表现强劲,海外云巨头持续加大投入,AI 模型加速迭代、推陈出新,AI+终端持续渗透

同时Sora 的发布或将成为 AI 视频应用的里程碑事件,视频生成工具可以大幅减少实景拍摄、降低视频制作成本,有望打开更为广阔的 AI 应用市场。

算力

OpenAI 表示,Sora所展现的能力表明,继续扩大视频模型规模能够更有效的模拟物理和数字世界中的人类、动物和物体,随着视频模型时长、分辨率等各项参数的进一步提升,将对算力提出更高的要求。

此外,Sora 仍为基于 Transformer 架构的扩散模型,在此基础上,Sora 与 Gen-2 等产品所形成的效果差异主要来自于大规模高质量的训练数据。

考虑到视频数据量相对文本和图片有几何级的提升,AI视频生成对训练和推理的算力需求将大幅提升,OpenAI、Meta 等巨头在算力领域持续布局,也侧面反映了未来对于算力的旺盛需求。算力支撑与大规模高质量数据训练仍为视频大模型必不可少的环节。

所以2024 年算力产业链将维持高景气度,训练和推理需求或将持续上升,蓬勃的算力需求有望持续带动算网基础设施建设,建议持续关注光模块、光芯片、光器件、AIDC、AI 服务器、交换机、液冷温控等领域投资机会


相关投资标的

短视频、传媒:因赛集团、国脉文化、中文在线、光线传媒

大模型及应用:万兴科技、剑桥科技科大讯飞、昆仑万维

算力及服务器:中际旭创、高新发展、中科曙光、浪潮信息、中兴通讯、国投智能


热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定