谷歌Gemini新版本发布：1.5 Pro升级至200万token，全新Flash版本闪亮登场-火星时代资讯

当地时间5月14号下午，谷歌在美国山景城召开了年度I/O开发者大会。

在110分钟的时间里，人工智能（AI）这个关键词被提到了121次，展现了谷歌在人工智能领域全力以赴的姿态和显而易见的野心。

作为谷歌的旗舰模型，Gemini及其各种迭代版本悉数亮相，抢尽了风头。谷歌正在将其整合到几乎所有自家产品中，包括安卓系统、搜索、浏览器和Gmail等等，各种演示看的人眼花缭乱。

此前，谷歌Gemini共有三个版本，分别是Ultra、Pro和Nano，尺寸不同，性能不同，应对的场景也有所差异。

现在，谷歌在大会上又推出了新版本，Gemini 1.5 Flash。谷歌表示，新的多模态模型与Gemini 1.5 Pro一样强大，但针对“高频、低延迟的任务”进行了优化。这使得它能够更好地产生快速响应。

谷歌还对Gemini 1.5进行了一些升级，据称这将提高其翻译、推理和编码的能力。此外，谷歌表示，它已将Gemini 1.5 Pro的上下文窗口增加了一倍，从100万个token增加到200万个。

目前，Gemini 1.5 Pro和1.5 Flash均已开放公共预览版。谷歌还披露，目前Gemini的开发者已经超过150万，超过20亿用户体验到了Gemini的强大。

在Gemini的加持下，多款谷歌产品迎来了新功能。比如，谷歌照片将于今年晚些时候新增Ask Photos功能，现在可以更好地搜索照片，识别不同的照片背景，寻找照片或回答其他照片内容问题。

谷歌CEO桑达尔·皮查伊表示，Gemini可以“将任何输入转化为任何输出”，从文本、照片、音频到实时视频中提取信息并回答问题。

谷歌在大会上宣布将推出一款名为Astra的新系统，承诺它将是谷歌迄今为止推出的最强大、最先进的人工智能助手。

当前一代的人工智能助手将重新命名为更先进的“代理”，据称可以具备推理、计划和记忆技能，并能够采取多个步骤来执行任务。

谷歌展示了人工智能代理对音频和视频输入的响应方式，与竞争对手类似。用户可以通过智能设备使用Astra，也在探索将其嵌入其他设备中。

在谷歌的演示视频中，用户使用智能设备进行摄像头扫描和定位，人工智能系统能够识别对象并进行记录。

“我们正处于（人工智能代理开发）的早期阶段。”谷歌CEO皮查伊表示。

“想象一下，这些代理可以看到和听到我们所做的事情，更好地了解我们所处的环境，并在对话中快速做出反应，使交互的速度和质量更加自然。”

科技公司正在竞争人工智能领域的“霸主”地位，而大型科技公司为了表明他们正在推动技术前沿的发展，人工智能代理成为了它们的“宠儿”。

许多科技公司都把人工智能代理放到了叙事当中，这些公司的目标是构建通用人工智能（AGI），这是一种关于超级人工智能系统的想法，在很大程度上仍处在设想阶段。

“最终，你将拥有一位真正了解你、可以为你做很多事情、可以跨多个任务和领域工作的代理。”教授表示。

谷歌在I/O大会上推出了更多新的人工智能功能。它通过人工智能概述的新功能将人工智能更深入地集成到搜索引擎中，为用户提供更具体答案。

给它一份食谱，Gemini将帮助用户计划需要做什么或者买什么。用户还能与人工智能系统对话，要求它完成各种任务。

谷歌还推出了Veo，一个新的视频生成人工智能系统，能够生成短视频，并理解提示，让用户更好地控制视频风格。

谷歌和OpenAI等公司正面临作家和艺术家的诉讼，声称他们的知识产权被使用。

为了更好地区分人工智能生成内容和真实内容，谷歌扩展了SynthID水印工具，提供更多保护措施。

谷歌Gemini新版本发布：1.5 Pro升级至200万token，全新Flash版本闪亮登场