当前位置：首页 >人工智能 >生成更美图像、直出分钟级视频，国产自研DiT架构的越级之旅

生成更美图像、直出分钟级视频，国产自研DiT架构的越级之旅

发布时间：2024-08-06 16:52:26 浏览量：249次

一转眼，2024 年已经过半。AI 尤其是 AIGC 领域出现一个越来越明显的趋势：文生图赛道进入到了稳步推进、加速商业落地的阶段，但同时仅生成静态图像已经无法满足人们对生成式 AI 能力的期待，对动态视频的创作需求前所未有的高涨。

因此，文生视频赛道持续高热，尤其是自年初发布 Sora 以来，以 Diffusion Transformer（DiT）为底层架构的视频生成模型迎来了井喷期。在这一赛道，国内外视频生成模型厂商们正默默展开着一场技术竞速。

在国内，一家成立于去年 3 月、专注于构建视觉多模态基础模型及应用的生成式 AI 初创公司智象未来（HiDream.ai），自主研发的视觉多模态基础模型实现了不同模态之间的生成转换，支持文生图、文生视频、图生视频和文生 3D，并推出了一站式 AI 图像和视频生成平台「Pixeling 千象」供社会大众上手使用。

体验地址：点击咨询

自智象大模型 2024 年 8 月上线以来，通过优化基础模型来深挖、拓展文生图和文生视频等 AIGC 能力，智象大模型再次迎来升级，基于中文原生的独有 DiT 架构释放出更强大、更稳定、对用户更友好的图像和视频生成能力，包括更具美感和艺术性的图像生成、图像中文字嵌入、分钟级视频生成等。

所有这些图像和视频生成新技能的展示，离不开智象未来在多模态视觉生成领域的技术积累和持续创新。

生成效果持续提升

更强大基模能力是引擎

智象大模型从一开始便瞄准了文本、图像、视频、3D 的联合建模，通过交互式生成技术实现精准可控的多模态内容生成，构筑强大的基模能力，让用户在其文生图、文生视频 AIGC 平台中有更好的创作体验。

此次智象大模型 2.0 的整体升级，相较于 1.0 版本在底层架构、训练数据和训练策略上均有质的变化，由此带来了文本、图像、视频和 3D 多模能力的又一次飞跃和交互体验上的切实提升。

文生图技能再进化

有了更高层次的「追求」

智象大模型 2.0 生成的图像更有美感、更具艺术性。智象大模型 2.0 生成的图像更有美感、更具艺术性。追求美感成为了此次文生图升级的重点。生成的两张图像，无论是构图色调，还是细节丰富度，看上去都有一种让人眼前一亮的感觉，这些都极大地拉升了整体画面美感。

除了让生成的图像看上去更美之外，生成图像的相关性也更强。智象大模型强化了对一些复杂逻辑的理解，使生成图像中不同物体、位置关系、

上一篇北师大未来设计学院在第六届中国教博会发布五项PBL大挑战项目

下一篇 AI 又开“画展”了!Google Brain 推出新的图像生成模型——Imagen

热门课程推荐

热门资讯

1. 华为手机神奇“AI修图”功能，一键消除衣服！原图变身大V领深V！

最近华为手机Pura70推出的“AI修图”功能引发热议，通过简单操作可以让照片中的人物换装。想了解更多这款神奇功能的使用方法吗？点击查看！
2. 四款值得推荐的AI以图生图软件，有需要的赶紧来试试!

近年来,人工智能逐渐走入公众视野,其中的AI图像生成技术尤为引人注目。只需在特定软件中输入关键词描述语以及上传参考图就能智能高效生成符合要求的...
3. 照片变漫画效果，这4个方法操作简单有效，快来试试吧！

想将照片变成漫画效果？这篇文章分享了4个方法，包括Photoshop、聪明灵犀、VanceAI Toongineer、醒图，简单操作就能实现，快来尝试一下吧！
4. 一款免费无限制的AI视频生成工具火了!国内无障碍访问!附教程

人人都可以动手制作AI视频! 打开网址https://pixverse.ai/,用邮箱注册后,点击右上角Create,就可以开始创作了。 PixVerse目前有文案生成视频,和图片生...
5. 赶紧收藏好!这4个完全免费的AI视频制作网站和工具

以下是一些免费的AI视频制作网站或工具,帮助您制作各种类型的视频。 1. Lumen5:Lumen5是一个基于AI的视频制作工具,可将文本转换为视频。用户可以使...
6. 零基础10分钟生成漫画，教大家如何用AI生成自己的漫画

接下来,我将亲自引导你,使用AI工具,创作一本既有趣又能带来盈利的漫画。我们将一起探索如何利用这个工具,发挥你的创意,制作出令人惊叹的漫画作品。让...
7. 四款软件让你一键生成AI美女!

就能快速生成一幅极具艺术效果的作品,让现实中不懂绘画的人也能参与其中创作!真的超赞哒~趣趣分享几款超厉害的AI绘画软件,提供详细操作!有需要的快来...
8. AI视频制作神器Viggle：让静态人物动起来，创意无限！

Viggle AI是一款免费制作视频的AI工具，能让静态人物图片动起来，快来了解Viggle AI的功能和优势吧！
9. 10个建筑AI工具，从设计到施工全覆盖!肯定有你从来没听过的

讲述了建筑业比较著名的AI公司小库科技做出的探索,在这儿就不多说了。今天,我们试着在规划设计、建筑方案设计、住宅设计、管道设计、出渲染图、3D扫...
10. Logo Diffusion——基于sd绘画模型的AI LOGO 生成器

这下LOGO设计彻底不用求人了。接下来详细演示一遍操作流程首先进入Logo D... 想学习更多AI技能,比如说关于怎么样利用AI来提高生产效率、还能做什么AI...

生成更美图像、直出分钟级视频，国产自研DiT架构的越级之旅

请绑定手机号