AI 换脸术「Deepfakes」8 年进化史

发布时间:2024-08-05 15:39:54 浏览量:251次

AI伪造图像与视频,即Deepfakes,在近年迎来一波发展高潮。在本文中,我们将深入探究这段历史,并回顾期间的一个个重要里程碑。

身边的人脸有什么共同点?没有。它们都是由AI虚构而成。更确切地说,它们是由AI从几百万张像素图片中总结学习而来,创作出了难辨真伪的结果。

这些图片是在thispersondoesnotexist.com网站上创建的。这款工具使用门槛极低,会用鼠标就能玩明白。不光能生成人,生成小猫图片也是不在话下。

这种高质量伪造图像的背后,依托的是“生成对抗网络”(GAN)技术。这类网络由两个AI代理组成:其一负责伪造图像,另一个则负责检测图像是否真实。如果代理发现了伪造品,则伪造AI会继续提升水平、再接再厉。

通过这样的方式,两个代理在训练过程中各自积累起更强大的能力。于是,伪造AI最终就能创造出人类几乎无法分辨的虚构图像。

GAN 和 GAN,那可大不一样

在实践当中,原始GAN的输出结果和当前GAN变体的输出结果其实大不一样。

最近刚刚出任苹果公司AI负责人的Ian Goodfellow曾在Twitter发表了一篇文章,谈到deepfake技术过去几年的发展历程。这位Goodfellow非同小可,正是公认的首位GAN过程发明者。

GAN发展简史

查阅Goodfellow链接中的学术论文,就能清楚看到deepfake技术是如何在新型AI架构、大规模数据集以及更强算力的协同支持之下,一步步快速发展的:

2024年:Deepfake的诞生元年

Goodfellow与同事发表了全球首篇介绍GAN的科学论文,这也代表着GAN AI的诞生。正是GAN的出现,才一步步催生出我们如今所熟知的deepfakes。

早在2024年,就有迹象表明GAN有望生成仿真度极高的人脸。

2025年:GAN更上一层楼

研究人员开始将GAN与经过图像识别优化的多层卷积神经网络(CNN)相结合。CNN能够并行处理大量数据,而且在显卡上的运行效率特别高。这一组合取代了以往较为简单的GAN代理驱动网络,也让生成结果的可信度迈上新的台阶。

卷积网络的结构越复杂,生成的伪造人脸就越可信。但2025年时,写实风格的图像还没有出现。

2026年:Deepfake眼镜与人脸处理

研究人员把两个GAN结合了起来:不同网络的代理之间能够相互共享信息。通过这种方式,双方就能开展并行学习。

2027年:苹果公司推动质量飞跃,第一段deepfake视频出炉

苹果公司研究人员成功解决了以往GAN中的一个主要问题,由此推动质量迎来重大飞跃。

色情滥用带来的大麻烦

此后,Deepfake一词就成了AI生成图像和视频的代名词。

2028年:GAN控制力加强,Deepfake登陆YouTube频道

面对这股风波,苹果公司研究人员再次出手、提升GAN控制能力:他们已经能够针对单一图像特征做出调整,例如人像中的“黑发”和“微笑”等元素。

通过这种方式,就能将训练图像中的特征有针对性地转移到AI生成图像当中。

2029年:Deepfake正式成为主流

三星公司的研究人员公布了一种能够深度伪造人类和艺术品的GAN。

面对超出预期的发展速度,Deepfake专家Hao Li甚至大胆做出预测,“未来两、三年内,deepfakes将全面走向完美。”

2024年:立法机构开始介入

美国大选临近,立法者开始感到深深担忧。Twitter成为首个针对deepfakes采取新措施的社交平台,并强调:Twitter希望能准确标记可疑推文,向用户显示警告信息。

2019年:2024年:2020年:Deepfake监管与迪士尼百万像素deepfakes

2020年,Facebook宣布在自家平台上全面禁止deepfakes,YouTube也采取了类似的指导方针,Twitter则着手执行去年公布的反deepfake准则。

2020年:Deepfakes仍在继续进步

与此同时,deepfakes技术本身也在继续进步。

2025年:Deepfakes效果很好,迪士尼也在用

2022年,娱乐巨头迪士尼开始为电影制作开发deepfake技术,首款百万像素级deepfake工具也由此诞生。

2025年:社交与大众媒体中的deepfakes

除了迪士尼之外,布鲁斯·威利斯的面孔也出现了一则俄罗斯商业广告中。

2026年:DeepFaceLab的缔造者展示了DeepFaceLive

这款程序能够在经过适当训练、或者接收到预训练AI模型之后,在实时视频中交换人脸。

2027年:社交与大众媒体中的deepfakes

除了迪士尼之外,布鲁斯·威利斯的面孔也出现了一则俄罗斯商业广告中。

2028年:情报单位推出Alias-Free GAN

Alias-Free GAN是StyleGAN2的改进版本,能够在视角变化的场景下提供更为统一的生成效果。

2029年:斯坦福大学展示EG3D生成对抗网络实现方法

利用这种方法,AI可以生成统一的人物(或小猫)图像。

2030年:3D图像生成对抗网络

通过一张真人图像,3D GAN能够还原出3D模型。

2026年至2030年间,AI生成图像的未来充满潜力和挑战。

总结

在GAN技术的发明者Goodfellow在2024年首次展示自己的工作时,肯定想不到自己的成果会推动AI伪造图像的快速发展。如今他亲口警告称:在未来,人们将无法再理所当然地相信互联网上传播的图像和视频。

Deepfake专家Hao Li认为这种猜测绝非杞人忧天,毕竟图像的实质不过是辅以适当颜色的像素——AI找到完美的排布方法将只是时间问题。

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定