发布时间:2024-05-21 09:38:24 浏览量:146次
Google DeepMind发布了新的Robotic Transformer 2(RT-2),这是一种视觉-语言-动作(VLA)模型,可以将知识转化为机器人控制的通用指令。
RT-2建立在Robotic Transformer 1(RT-1)的基础上,通过多任务演示训练,展现出超越机器人数据的泛化能力。
RT-2以VLM为基础,实现了对机器人的控制,通过Pathways Language and Image model (PaLI-X)和Pathways Language model Embodied (PaLM-E)的支柱。
相比之前的模型,RT-2的泛化性能大幅提高,Google DeepMind进行了大量机器人试验并展示了优秀的机器人策略。
从VLM到VLA,主要进展在于将机器人动作指令直接作为模型token输出,省去了VLM模型将输出的指令翻译成底层控制信号的步骤。
RT-2表明VLM可以转化为强大的VLA模型,通过PaLI-X和PaLM-E带来了高度改进的机器人策略和更好的泛化性能。
ViT模型将语言模型的transformer架构用于视觉模型,统一了CV和NLP的架构。2020年,谷歌推出Vision Transformer(ViT)模型,证明了直接将Transformer结构应用于视觉模型的成功。
机器人软件模型算法不断提升,有望加速提升通用机器人与行业机器人的可能性,带动下游需求产生。
行业机器人分为工业机器人、服务机器人和特种机器人,将有望广泛应用于各个行业领域。
行业机器人的发展将加速行业智能化进程,多模态GPT的快速发展助力机器人在交互、规划、泛化和感知能力方面提升。
火星时代教育认为机器人软件系统迭代加速,将推动机器人应用在各个行业领域。我们期待在未来几年内看到机器人在智能家居、通用机器人、虚拟现实等领域的应用。
机器人技术迭代不及预期风险:若机器人技术迭代不及预期,则可能对产业链相关公司造成不利影响。
经济下行超预期风险:宏观经济景气度下行可能影响整个产业链的发展和增长。
行业竞争加剧风险:行业内竞争加剧可能会对企业增长产生威胁。
热门资讯
想将照片变成漫画效果?这篇文章分享了4个方法,包括Photoshop、聪明灵犀、VanceAI Toongineer、醒图,简单操作就能实现,快来尝试一下吧!
2. 华为手机神奇“AI修图”功能,一键消除衣服!原图变身大V领深V!
最近华为手机Pura70推出的“AI修图”功能引发热议,通过简单操作可以让照片中的人物换装。想了解更多这款神奇功能的使用方法吗?点击查看!
近年来,人工智能逐渐走入公众视野,其中的AI图像生成技术尤为引人注目。只需在特定软件中输入关键词描述语以及上传参考图就能智能高效生成符合要求的...
4. AI视频制作神器Viggle:让静态人物动起来,创意无限!
Viggle AI是一款免费制作视频的AI工具,能让静态人物图片动起来,快来了解Viggle AI的功能和优势吧!
5. Logo Diffusion——基于sd绘画模型的AI LOGO 生成器
这下LOGO设计彻底不用求人了。接下来详细演示一遍操作流程首先进入Logo D... 想学习更多AI技能,比如说关于怎么样利用AI来提高生产效率、还能做什么AI...
6. 零基础10分钟生成漫画,教大家如何用AI生成自己的漫画
接下来,我将亲自引导你,使用AI工具,创作一本既有趣又能带来盈利的漫画。我们将一起探索如何利用这个工具,发挥你的创意,制作出令人惊叹的漫画作品。让...
以下是一些免费的AI视频制作网站或工具,帮助您制作各种类型的视频。 1. Lumen5:Lumen5是一个基于AI的视频制作工具,可将文本转换为视频。 用户可以使...
8. AI显卡绘画排行榜:4090无悬念,最具性价比出人意料
在AI绘图领域,Stable Diffusion的显卡绘图性能备受关注。本文整理了Stable Diffusion显卡的硬件要求和性能表现,以及2023年3月显卡AI绘图效率排行榜和性价比排行榜。欢迎查看最新的AI显卡算力排行榜。
9. 一款免费无限制的AI视频生成工具火了!国内无障碍访问!附教程
人人都可以动手制作AI视频! 打开网址https://pixverse.ai/,用邮箱注册后,点击右上角Create,就可以开始创作了。 PixVerse目前有文案生成视频,和图片生...
就能快速生成一幅极具艺术效果的作品,让现实中不懂绘画的人也能参与其中创作!真的超赞哒~趣趣分享几款超厉害的AI绘画软件,提供详细操作!有需要的快来...
同学您好!