告别无声电影!谷歌AI视频生成语音技术震撼登场!

发布时间:2024-08-20 09:32:32 浏览量:135次

机器之心报道

编辑:杨文

AI圈这遍地开花的大好局面,让吃瓜群众们甚是惊喜。

这几天,大洋彼岸热闹非凡!Luma 的火热还未消退,昨晚 Runway 推出的 Gen-3 Alpha 简直震惊全网。(查看详情请移步:点击咨询

没想到,Google DeepMind 也跳出一个大招,公布了视频生成语音(V2A)技术的最新进展。

虽然这项功能尚未向公众开放,但从官方发布的视频 Demo 来看,效果相当出色。Google DeepMind强调,所有示例均由V2A技术和他们最顶尖的生成视频模型Veo合作打造。

黑灯瞎火的废弃仓库里,一个身穿黑衣的人如幽灵般缓步而行,配以阴森音乐和脚步声,恐怖氛围达到巅峰。

视频 Demo 一经发布,评论区热火朝天:何时才能使用呢?

AI 视频告别无声电影

视频生成模型飞快发展,但无一不是“无声电影”,不管是 Sora 还是最新的可灵、Luma、Gen-3 Alpha。

而 Google DeepMind 的视频生成音频(V2A)技术,则让视听同步成为可能。结合视频像素和自然语言提示,为屏幕动作产生丰富配音。

点击咨询,AI视频再也不会无声!

背后的工作原理

研究团队尝试了自回归和扩散方法,探索最可扩展的AI架构。扩散方法在音频生成方面表现最真实迷人,用于同步视频和音频信息。

想了解更多工作原理?点击咨询

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定