「AI设计多模态模型DesignGPT」领跑AI图像生成 未来设计人机协同|项目报道

发布时间:2024-05-09 12:31:19 浏览量:165次

从《太空歌剧院》,到“特朗普被捕”图和AI版《流浪地球3》“预告片”,AI图像生成堪比人类作品的细腻程度和真实感,一次次刷新了人们对AI创造力的认知。

在一片“AI正威胁人类艺术家和设计师饭碗”的感叹声中,上述作品背后的Midjourney也顺理成章地坐上了生成式AI图像领域的第一把交椅。

然而,在进化智能创始人李嘉翔看来,细腻度和真实感代表的AI图像生成效果,仅是AI变革人类创意、设计领域的必要条件之一。他认为,AI生成图像领域要真正产生颠覆性影响,就需要将专业设计师的能力封装为稳定、可靠的标准产品,并达到可规模化商用的水准。

这也正是进化智能旨在达成的目标。

公司成立于2022年,是2023年清华“清醒杯”大模型应用创业挑战赛冠军、互联网+清华校赛的冠军项目。公司创始团队由来自国内外顶尖高校以及科技企业的成员组成,具备技术研发和设计认知跨学科背景。

创始人兼CEO李嘉翔,硕士就读于清华大学工业设计系,是清华特等奖学金得主,曾获红点、iF等顶尖设计奖;CTO stelleris博士就读于中山大学,熟悉计算机视觉、图像-语言多模态模型等AI领域主流理论和技术。

目前,进化智能已推出设计领域的多模态模型「DesignGPT」,主要面向企业客户提供可调用的标准化模型API接口,同时支持包括行业、企业、产品级别的模型定制、创意和营销方案生成等在内的整体解决方案交付。另外,公司将3D技术和AI结合,支持客户上传3D模型进行全视角产品渲染。

「DesignGPT」接入了大语言模型,支持用户通过自然语言对话实现设计。技术层面,DesignGPT采用基于LLM的级联模型架构,基于Diffusion理论构建,配合底层视觉大模型强化视觉效果。

和“拿着锤子找钉子”不同,进化智能成立之初即聚焦打造专业级设计AI大模型,为垂直行业提供系统解决方案。

在产研阶段,团队对目标客户和应用场景有了较清晰的构思:一是瞄准有高频需求、高质量要求的行业,二是关注企业的营销和产品设计侧需求,与目标行业的头部客户合作。

李嘉翔介绍,早在一年前就基于Disco Difussion模型生成了多款风格的球鞋设计,并带着作品参展了U设计周,通过这些经历,他认识到通过AI进行设计创新的巨大潜力。

“设计效率低、周期长、成本高是设计领域长期以来面临的问题。”李嘉翔表示,“尽管设计师的核心能力是审美和市场嗅觉,其对不同品类设计美的理解是互通的,个人精力却是有限的。”

基于现有研发成果,进化智能构建了从数据收集、分析到数据标注、模型设计和训练等整个流程的算法和技术框架。

在图像生成精确性方面,进化智能的特色是能满足客户对于细节修改的需求。具体到设计场景中,用户可以选择只更换特定部位的颜色生成效果。

市场方面,公司已累计服务数十家企业,与多个行业的头部客户签单;进化智能在早期与「玛莎拉蒂」合作为其新车型定制了专属模型,用于生成营销图。关于中小企业是否可负担的问题,李嘉翔表示AI出图的性价比高。

谈及AI是否会取代设计师,李嘉翔指出:“尽管AI具有强大的计算和分析能力,但真正的创新设计还需要人类的直觉和情感。”他认为,未来的设计是人机协同,AI将成为设计创新的重要推动力。

想了解更多关于AI设计多模态模型的内容?快来点击咨询吧!

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定