2秒创建图像!ETRI开发出超快速生成视觉智能模型:速度提升5倍【AIGC附技术赛道观察图谱】

发布时间:2024-07-26 17:04:26 浏览量:142次

瞻观前沿

电子电信研究所的研究人员推出了一项将生成式人工智能和视觉智能相结合的技术,只需2秒即可根据文本输入创建图像,推动超快速生成式视觉智能领域的发展。ETRI宣布向公众发布五种型号。其中包括三个模型“KOALA”,它从文本输入生成图像的速度比现有方法快五倍,以及两个会话视觉语言模型“Ko-LLaVA”,它可以用图像或视频进行问答。

“KOALA”模型使用知识蒸馏技术,将参数从公共 SW 模型的7亿显着减少。研究人员将模型大小减少了三分之一,并将高分辨率图像的生成速度提高到以前的两倍,与DALL-E 3相比快了五倍。ETRI成功地大幅减小了模型的大小,并将生成速度提高到2秒左右,使其能够在仅8GB内存的低成本 GPU上运行国内外文本到图像生成的竞争格局。

研究团队预计,生成人工智能市场将从以文本为中心的生成模型逐渐转变为多模态生成模型,在模型大小的竞争格局中,将出现更小、更高效的模型的新趋势。

图片来源:摄图网

技术价值观察

我国的AIGC产业可大致分为基础设施层、模型层及应用层,目前整体层级尚不够完整,模型层成为当前关键卡口。在一定程度上限制了上下层级的发展。

基础设施层主要分为数据层、算力层、计算平台、模型开发训练平台和其他配套设施。在模型层则分为底层通用大模型和中间层模型。应用层即面向C端用户的图像、文字、音视频内容生成服务。

电子电信研究所的研究人员推出的“KOALA”模型将图像生成速度提高到2秒左右,处于产业链的模型层。

宏观市场观察

——AIGC定义及分类

AIGC是基于大型预训练模型、生成对抗网络等人工智能技术的内容生成方式。行业从狭义上涵盖图像、文本、音频、视频等内容生成,广义上则包括策略生成、代码生成等。

合成数据为AI模型训练开发提供强大助推器,加速人工智能走向2.0阶段。合成数据产业成为新的数据要素市场新赛道,大厂和创新企业竞相布局。

中国AIGC行业在金融、电信制造、医疗等领域加速渗透,促进产业升级。AI技术为各行业创造巨大经济价值。

——AI大模型是一种新的智能计算范式

AI大模型是一种新的人工智能计算范式,具有更好的泛化性,可应用于更广泛的下游任务中。多模态大模型也在快速发展,AI内容生成已成为下一个AI发展的重点领域。

中国的AIGC行业企业竞争激烈,头部互联网企业具有优势,但后来者众多,市场竞争度较高。

中国人工智能技术赛道热力图

与人工智能关键技术强关联的城市集群主要集中在华南和西北地区,并且以广深、西安市为重点发展区域,可关注广州市、深圳市、西安市的人工智能相关企业。

更多本行业研究分析详见火星时代教育的关于数字艺术培训的报告。

更多行业分析尽在点击咨询

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定