Sora文本转视频功能太强?国内开始复制,有大厂已经行动

发布时间:2024-03-28 17:39:10 浏览量:126次

Open AI的Sora文本转视频功能,在这段时间一直是热点,引起了全球的关注。Open AI又给全球放了一个超大的卫星,从Sora这个文字转视频的AI功能来看,效果之出色的确出乎所有人的意料。国内用户和从业者无论是有着震惊、羡慕、质疑或者不屑的态度,但在AI应用层面都得承认,海外的确是比国内要强出很多。不过国内从业者现在也开始准备复制Sora的文本转视频功能,而且已经取得了一些成效。

根据国内媒体的报道,北京大学的研究人员和深圳一家名为Rabbitpre的人工智能公司合作,启动了一个名为Open-Sora的项目,这个项目的目标是在开源社区的帮助下创建OpenAI文本转视频模型Sora的一个版本,该版本更易于使用且更具可扩展性。这显然是国内AI从业者想要跟上国外步伐的一个举措,而且开起来还是个开源项目,这更具有道德的高度以及可操作性,剩下的问题就是能不能成功了。

作为一个开源项目,整个项目当然会放在GitHub页面,不过略显讽刺的是,这虽然是国内AI从业者的项目,但GitHub页面我们都知道不是那么容易被国人访问的,虽然我们自己倒清楚,要玩这类项目的人应该不会被这个问题难住……据悉Open-Sora这个项目开发了一个由三部分组成的框架,并已经展示了四个重组视频的演示,看起来还是有不小的进展。

这个开源项目未来的目标包括完善技术以生成更高分辨率的视频,并通过额外的数据和更多的图形处理单元加强培训,从而为服务提供更多的算力。这些步骤对于提高模型的性能并扩展其生成更详细和更长视频的能力至关重要。也就是说如果这个项目发展下去,依然需要高算力的AI芯片。

除了这个国人发起的开源项目以外,其实国内的几大互联网公司在文本转视频上,也有着自己的动作。根据我们的了解,包括腾讯和字节跳动都涉足了文本转视频的领域。腾讯AI发布了一个名为VideoCrafter2的软件,这是一个开源视频生成和编辑工具箱,能够从文本生成视频,不过时间仅限于两秒;字节跳动的MagicVideo-V2则结合了各种模块来创建端到端视频生成管道。应该说国内的厂商们其实都在努力,但差距的确还是比较大。

对于国内文本转视频这部分的发展,不少人还是抱有期待,一些公司渴望利用文本到视频的人工智能模型,如果有哪家公司推出相应的产品……但更多人还是对中国目前AI发展感到一些担忧,毕竟AI项目需要大量的算力,这部分海外明显强过国内太多,而且由于出口管制的存在,海外的高端AI芯片无法出口到国内,而国内自主研发的AI芯片在性能和产能都无法和海外相比,这可能会大大延缓国内AI技术的发展。

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定