Sora带领AI时代飞跃,“U-AIGC”新概念即将崛起

发布时间:2024-05-16 11:28:04 浏览量:186次

2024年,以Sora为首的多模态大模型,或许将带我们走向更超乎想象的远方。

将心中所想的文字直接变成视频,过去只存在于科幻作品,而现在,幻想正无限接近现实。

即便尚未对公众开放,由OpenAI发布的Sora已经在短短几天超越“GPT”们,成为大众讨论度最高的AI界“新晋顶流”——仅在Tik Tok平台上发布的视频,就为OpenAI在4天内“吸粉”10万。

“AI产品在以UGC为核心的平台上惊艳亮相,可能是AI时代的一个重要转折。”对于Sora带来的影响力以及AI大模型领域的未来发展前景,复旦大学管理学院信息管理与商业智能系讲师李文文分享了她的最新观察。

在应用层面,Sora会带来哪些新变化?

首先,“真实”与“虚拟”的边界将愈发模糊。

Sora能够生成非常逼真、高清晰度的视频和照片。因为具有多角色、特定类型运动以及细节准确的主题背景构建能力,乍看之下,人们甚至很难分辨哪些是真实拍摄的视频,哪些又是Sora生成的视频。

需要注意的是,Sora并非单纯的“视频模型”,而被视为一种“世界模拟器”, 是OpenAI“教AI理解和模拟运动中的物理世界”计划中的一步,目的是帮助人们解决需要现实世界交互的问题。

在这个过程中,凭借以假乱真的视频生成能力,Sora的出现势必能为很多行业带来新的机遇,例如短视频和游戏行业等。与此同时,传统的影视制作流程和商业模式也可能面临重塑。例如,使用AI生成视频的需求增加,相应可能会减少对人类演员、编导等创造性角色的用人需求,影视行业的就业格局就很可能发生巨大变化。

另一方面,AI技术强大的图片和视频生成能力,已经引发了人们对于伪造照片和视频的担忧。这类AI技术可能加剧虚假信息的泛滥,因此我们也需要多角度地思考“真实”与“虚拟”交融所带来的影响。目前,Sora也正在进行评估关键领域潜在危害或风险的工作,OpenAI还邀请了一批视觉艺术家、设计师和电影制作人加入,期待这些反馈可以进一步完善Sora的能力。

其次,人与AI之间的新交互与新关系。

GPT和Sora的出现彻底变革了人机交互模式,让用户通过直接说话与AI交流,让自然语言交互成为可能,极大地提高了可操作性。较之于传统的图形用户界面,自然语言是人类最自然的交互方式,几乎不需要学习,且交互效率更高。

新的交互模型会如何影响组织中的人机协同?很多人都会提出这样的问题:“AI到底会辅助人类的工作,与人类合作,还是取代人类的工作?”“人机共生是否不再遥远?”“人类与机器的关系将何去何从?”而眼下,这些疑问已经不再是“遥远的想象”,而是近在咫尺,甚至“迫在眉睫”。

我认为,对于个体而言,技术进步虽然带来了不少挑战,但也提供了新的机遇。与其盲目担忧工作被取代,不如思考我们应该如何定位自己,如何适应AI时代,如何将技术为我所用。

换一个角度来看,AI中的“A”可以解读为assistance和augmentation,AI应该作为人类的“辅助”“增强”工具,而不是替代工具,或者说,AI应该是人类的工作伙伴。

AI的意义在于让更多人从简单重复的劳动中解脱出来,以更高的效率去创造更大的价值。当自然语言的交互模式极大降低了AI技术的应用门槛,任何人都能够简单地使用AI辅助自己的工作。例如,Sora让视频制作更加简单高效,让更多人将自己的想法转化成生动的视频,也可以让人们更加聚焦于创意和故事本身,所以,未来基于Sora的U-AIGC可能会越来越多。

最后,中国科技企业“逐浪”还是“造浪”

从ChatGPT到Sora,大模型为科技公司不断带来充满前景的新赛道。仅最近8个月内,中国就诞生了238个大模型,几乎一天一个。

然而,当ChatGPT拉高了用户和市场对于大模型性能的要求后,训练大模型将意味着投入更多人力、算力和数据量,以提升模型性能,满足用户需求以及市场的期待。

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定