Google/IO大动作!Gemini 1.5、Gemma 2、Project Astra震撼亮相

发布时间:2024-05-17 18:08:21 浏览量:242次

Google/IO大动作!Gemini 1.5、Gemma 2、Project Astra震撼亮相

下面的内容均来自凌晨 Google/IO 2024,内容实在太多了,挑了一些重要的,有能力还是看直播回放吧!

Gemini 1.5 Flash

新增的轻量级模型,专为速度和效率优化。适用于大规模的高容量、高频任务。通过“蒸馏”过程训练,从更大的 1.5 Pro 模型中提取关键知识和技能。

Gemini 1.5 Pro

过去几个月中显著改进,包括扩展到 200 万个令牌的上下文窗口。增强了代码生成、逻辑推理、规划、多轮对话以及音频和图像理解。

Gemini Nano

Google AI 正在通过内置到 Android 操作系统中来革新 Android 设备,即将在 Pixel 上推出的 Gemini Nano 将能够处理文本输入,并理解更多上下文信息,如视觉、声音和口语。

更多细节要等到明天,我猜是直接作为系统 API 调用,未来可能调用本地算力就像调用系统相机那样用户同意即可。

PaliGemma

开源开放式视觉语言模型(VLM),灵感来自 PaLI-3。结合 SigLIP 视觉模型和 Gemma 语言模型,针对多种视觉语言任务设计。

Gemma 2

Gemma 2 拥有 270 亿参数,性能可与 Llama 3 70B 相媲美,但模型更小,优化设计降低了部署成本,支持 NVIDIA GPU 和 Vertex AI 的 TPU。

Project Astra

一个实时演示,展示了未来 AI 助手的愿景。基于 Gemini,开发了能够更快处理信息的原型代理,通过连续编码视频帧,结合视频和语音输入,形成事件时间线,并缓存信息以便高效回忆。

VideoFx Veo

由 Google DeepMind 推出的 Veo 能够生成高质量的 1080p 视频剪辑,最长可达 60 秒。其支持从写实到超现实和动画等各种电影风格。

  • 高质量 1080p 视频剪辑
  • 支持超过 60 秒的视频
  • 通过文本提示生成视频

ImageFx Imagen 3

由 Google DeepMind 推出的 Imagen 3,可以将文字描述转换成逼真的图像,适用于多种风格和场景。

Imagen 3 通过改进的算法,能够更准确地理解文本提示,生成细节丰富、风格多样的图像。它还能根据不同任务优化版本,比如快速草图或高清图片。目前,它在 ImageFX 上提供私有预览,并即将登陆 Vertex AI。

Google Search 进入 Gemini 时代

Project IDX:无需候补名单

一个类似 Remote VS Code 的项目,之前有体验过,最牛逼的是可以直接免费用云 IOS、Android 来开发 Flutter 项目。现在可以直接用了,还改进了 Gemini 的 AI 辅助。

Chrome:集成 Gemini Nano

Chrome 浏览器将在 126 版本引入 Gemini Nano 本地模型,与Edge 不同,Nano 将完全在本地运行。另外开发者工具也会集成 Gemini,为开发者分析报错

想了解更多关于数字艺术教育的信息吗?欢迎点击点击咨询,火星时代教育竭诚为您提供优质教育服务!

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定