ChatGPT核心方法应用于AI绘画,效果提升47%!

发布时间:2024-10-03 12:06:12 浏览量:139次

在AI领域,有一种核心训练方法叫做“人类反馈强化学习(RLHF)”,它能让模型更安全、更符合人类意图。

研究人员发现,将RLHF方法用于AI绘画中可以显著改善图像的匹配情况,效果惊人,达到了高达47%的改进。

AI绘画效果对比

这项技术让AI领域中的模型找到了一种“共鸣”。

如何运用RLHF技术进行AI绘画?

RLHF是一种由OpenAI和DeepMind合作开发的强化学习技术,通过人类的评价来直接优化模型,在AI图像生成模型中,它能让生成图像与文本提示更好地对齐。

具体步骤包括收集人类反馈数据,学习奖励函数,辅助任务以及微调模型,以提高图像生成的准确性。

收集人类反馈数据

通过RLHF技术,AI绘画模型的人类满意度提升了47%,但也有5%的图像清晰度下滑。

训练奖励函数

作者表示,使用更大的人类评价数据集和更好的优化方法能够改善这种情况。

关于作者

本文共有9位作者,包括谷歌AI研究科学家Kimin Lee等。

9位作者

其中,华人作者包括Liu Hao、Du Yuqing和顾世翔,他们在AI领域有着卓越的研究成果。

顾世翔

写这篇文章时,顾世翔还是谷歌人,现已跳槽至OpenAI,致力于ChatGPT项目。

更多详情请访问 点击咨询

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定