谷歌发布Gemini 时代全新智能产品,携手AI进军未来

发布时间:2024-06-16 16:30:52 浏览量:132次

5月15日,在2024年I/O开发者大会上谷歌宣布全面进入Gemini时代。大会中,谷歌CEO桑达尔·皮查伊(Sundar Pidal)发布数十款Google和 AI 结合产品,堪称“全家桶”级别,全力对战OpenAI。

谷歌Gemini产品发布

全新Gemini 1.5 Pro支持200万token长文本的Gemini 1.5 Pro。Gemini 1.5 Pro具有原生音频理解、系统指令、JSON模式等,能够使用视频计算机视觉来分析图像(帧)和音频(语音)的视频,这使其具有人类水平的视觉感知。使用深度神经网络,Gemini 1.5 可以以超人的精度识别图像(和视频帧)中的物体、场景和人物。同时,Gemini 1.5 Pro支持200万token长文本,增强了代码、逻辑和图像理解方面的性能。

为了快速响应与成本效益的需求,谷歌还推出更快、更经济的轻量化推理模型Gemini 1.5 Flash,成本低至0.35美元每百万tokens。

同时谷歌发布首个AI Agent产品Project Astra,对标OpenAI早前发布的GPT-4o。作为全新的AI助手,具备强大多模态理解和实时对话能力,通过手机捕获的视频和语音识别来实现高效信息处理。

视频演示中,当被问到:“你记得我把眼镜放哪儿了吗?”Project Astra使用摄像头帮助追踪他们之前放置眼镜的位置,“你的眼镜放在桌上的红苹果旁边。”Astra准确的说出了眼镜的位置。

谷歌表示,Gemma 2将在未来几周内正式公开上线和发布。同时,Google的第一个视觉语言开放模型PaliGemma 也同步发布,PaliGemma 是一个功能强大的开放式 VLM,其灵感来自PaLI-3。

谷歌还发布了一款全新的视觉模型——Veo,可生成1080P的高质量视频,具备高级的自然语言和视觉语义理解能力,可以准确呈现细节并捕捉情感基调。

在Google Search方面,新版AI搜索结果页面更加智能化和个性化,将支持多轮推理、规划能力等,用户还可以通过视频提问,从而允许 Google 搜索分析视觉内容并提供有用的反馈。

据悉,在今天召开的 I / O 2024 开发者大会上Google宣布Android 15已融入谷歌Gemini大模型升级后的能力。

除以上提及的新产品新升级,Google I/O2024大会还公布一些新模型和新工具,包括Imagen 3 最高质量的文生图模型,支持AI音乐创作的Imagen 3,以及基于Gemini针对学习进行微调的新系列模型LearnLM等。除了AI搜索外,拓展了包括Google Workspace、Gemini Live、Gems、Gemini Advanced、画圈即搜等新功能。

作为AI领域的领头羊,谷歌在本次I/O开发者大会上展示了强大的研发实力和技术创新,共同开创Gemini时代的智能新未来,引领行业发展潮流。


火星时代教育致力于数字艺术教育领域30年,提供游戏设计培训、动画培训、原画培训、AI创作培训、影视后期培训、短视频制作、室内设计培训、UI设计培训、插画培训等课程。欢迎点击点击咨询了解更多。

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定