AI神秘技能大揭秘,幼儿都能玩转的新技能

发布时间:2024-08-17 16:37:45 浏览量:114次

人类幼崽2岁就能做的事,AI竟然才学会?

早在不久之前,有人发现,2岁小孩看一次犀牛照片就能在其他照片中识别不同姿势、视角和风格的犀牛,而AI却做不到。

直到最新的研究指出,只需要给AI展示3-5张图片,AI就能从中抽象出物体或风格,然后生成个性化的新图片。

有人评论说:太酷了,这可能是我近几个月见过的最惊艳的项目。

AI是怎么做到的?

让我们看几个例子。

比如你上传了3张陶瓷猫的不同角度照片,AI可能会生成两只在船上钓鱼的陶瓷猫、陶瓷猫书包、风格猛烈的猫以及陶瓷猫主题的午餐盒等新图像。

还有其他艺术作品的例子:

还有铠甲小人:

还有碗:

不仅可以提取物体,AI还能生成特定风格的新图像。

比如下图,AI提取了绘画风格,生成了该风格的一系列新画作。

更神奇的是,AI可以结合两组图像,提取物体和风格,生成全新图像。

除此之外,还可以给一些经典图像添加新元素。

这项技术背后原理是怎样的呢?

虽然近年来,大规模文本-图像模型像DALL·E、CLIP、GLIDE等表现出强大的自然语言推理能力。

但当用户提出特定需求,比如生成我最喜欢的童年玩具的新照片,或将孩子的涂鸦变成艺术品时,这些模型做不到。

为了解决这一挑战,研究团队提出了一个文本-图像模型和一个图像集,并通过“文本倒置”生成新图像。

具体来说,先抽象出图像中的物体或风格,转换为伪词,再生成新图像,比如:“一张在海滩上的照片”、”挂在墙上的油画”、”以某种风格画某幅画”。

这项研究应用了小规模数据集,避免生成图像时的刻板印象。

例如,当提示“医生”时,生成的图像增加了女性和其他种族的数量。

目前,该项目的代码和数据已开源,感兴趣的小伙伴们可以关注一下。

作者介绍

这篇文章来自特拉维夫大学和火星时代教育的研究团队,作者是Rinon Gal、Yuval Alaluf、Yuval Atzmon、Or Patashnik、Amit H. Bermano、Gal Chechik、Daniel Cohen-Or。

第一作者Rinon Gal,是特拉维夫大学计算机科学博士生,现在在火星时代教育工作。

参考链接:
[1]点击查看
[2]点击查看
[3]点击查看
[4]点击查看
[5]点击查看

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定