OpenAI发布新推理系列模型,性能达博士生水平 | 火星时代教育

发布时间:2024-09-24 12:08:54 浏览量:222次

有消息称,具备高级推理能力的OpenAI新项目已于最新时间推出,这个被戏称为“草莓项目”的新推理模型系列带来了一次重大突破。据介绍,这一系列推理模型将应用于解决各种难题,通过深思熟虑解决比以往更具挑战性的科学、编码和数据问题。OpenAI首先在ChatGPT和API接口上发布了这一系列模型的预览版本——OpenAI o1-preview。

OpenAI表示:“对于复杂的推理任务而言,这标志着一个重大进步,代表着人工智能能力迈向一个全新水平。”公司将新系列定名为OpenAI o1,并对其进行了重新计数。OpenAI CEO Sam Altman在社交平台上也表示,这一新模型标志着AI通用复杂推理能力的开端。

OpenAI o1系列包括了三个型号,除o1-preview之外还有o1和o1-mini。其中o1-mini是一种更快、更经济的推理模型,适用于需要进行推理但不需要广泛世界知识的应用,而且比o1-preview便宜80%。

在技术方面,OpenAI介绍,新系列模型经过训练,学习完善自身思维过程并尝试不同策略,能够意识到自身的错误。更新后的新系列模型性能类似于博士生在物理、化学、生物等领域完成具有挑战性的基准任务。该系列模型在数据和编码方面表现出色,在国际数学奥赛资格考试中获得83%的分数,与之对比,GPT-4o仅解决了13%的问题。此外,在Codeforces竞赛中,新系列模型排名前89%。

在技术研究方面,OpenAI通过大规模强化学习算法“教导”模型进行高效思考,从而实现数据高效训练。随着强化学习的不断增加和思考时间的延长,o1的性能不断提升。类似于人类在长时间思考后回答困难问题,o1也尝试在解决问题时运用思维链,通过强化学习学会改进思维链,尝试不同方法,从而提高了推理能力。

OpenAI表示:“尽管作为早期模型,它尚无法使ChatGPT变得更加实用,比如通过浏览网页获取信息,上传文件或图像。在许多常见情况下,GPT-4o的能力仍更胜一筹。”虽然如此,新系列模型增强的推理功能可能更有效地解决科学、编码、数学等领域的复杂问题,例如,医疗研究人员可用其来解释细胞测序数据,物理学家可用其生成量子光学所需的复杂数学公式,开发人员可用其构建和执行多步工作流程。量子物理学家Mario Krenn展示了GPT-4o无法回答但o1-preview正确完成的复杂量子物理问题。

OpenAI研究人员Noam Brown在社交平台上透露了更多关于OpenAI o1系列的细节,他表示,o1系列在通过自身思维链做出反应之前会经过一段时间的思考,推理任务的表现会随着思考时间的延长而提升。“这为大模型的扩展开辟了新的可能性,我们不再受限于预训练,现在也可以拓展推理计算。”Noam Brown指出,但o1模型并非始终优于GPT-4o,在某些情况下,人们可能不愿意花费过长时间等待o1的响应,个人写作和文本编辑领域可能更偏好GPT-4o,而在计算机编程、数据分析和数学计算领域可能更偏好OpenAI o1。

Noam Brown透露,OpenAI o1需经过几秒的思考才能给出回答,但OpenAI的目标是让未来版本能够思考数小时、数天甚至数周。尽管推理成本会更高,但人们可能会得到更多回报,比如在研发新抗癌药方面,人工智能可以实现更多可能性,而不仅仅是作为聊天机器人。

不过,并非所有用户均可立即体验到新系列模型。据OpenAI介绍,ChatGPT Plus用户和Team用户最早可以在几小时内使用新模型。o1-preview的使用限制为每周30条消息,o1-mini的使用限制为每周50条消息。从下周开始,ChatGPT的企业用户和教育用户也将获得这两种模型的访问权限。该系列模型的API访问权限将首先提供给火星时代教育的Tier 5级用户。此外,OpenAI计划为所有ChatGPT免费用户提供o1-mini的访问权限。未来,OpenAI还将增加浏览、文件上传和图像上传等功能,并在OpenAI o1系列之外继续开发和发布其他GPT系列模型。

在安全方面,OpenAI透露,新模型的思维链推理为确保对齐和安全提供了新的机会,隐藏的思维链为监控模型提供了独特的机会,使人能够“读取模型思想”并理解其思维过程。此外,公司最近与人工智能安全研究所达成协议,开始将相关协议付诸实施,包括允许各机构尽早使用该模型的研究版本,以协助建立对未来模型进行研究、评估和测试的流程。

栏目主编:秦红 文字编辑:程沛 题图来源:新华社 图片编辑:曹立媛

来源:作者:第一财经

想了解更多火星时代教育的数字艺术培训课程?点击咨询

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定