阿里出新招,AI让照片活过来

发布时间:2024-06-12 14:56:29 浏览量:159次

阿里推出AI图生视频模型EMO

只要一张照片加上音频,就能让你说话唱歌,阿里做到了。

最近,阿里新上线了一款AI图片-音频-视频模型技术EMO,用户只需提供一张照片和一段音频文件,EMO即可生成会说话唱歌的AI视频,最长时间可达1分30秒左右。阿里研究团队表示,EMO生成具有表情丰富的面部表情和各种头部姿势的声音头像视频,同时,根据视频长度生成任意持续时间的视频。

你可以用单张静态AI美女头像生成唱歌视频,让AI模拟前段时间生成的唱歌女主角,口型、语速也完全匹配。

EMO框架介绍 图源:GitHub官网

结合最近全球爆火的消息和国内各大公司的AI布局,阿里推出EMO模型,跟上市场形势。视频生成模型赛道已成科技互联网公司的重点。阿里不断投资AI方面,去年推出“通义千问”语言大模型,改造所有产品,包括电商业务、淘宝问问AI产品等。

阿里云在AI方面的布局提升整体市场竞争力,为各业务提供自然语言处理、图像识别等服务,推动业务创新。阿里云发布一系列生成式AI模型,如“通义听悟”和“通义万相”,缓解人们在音视频处理、绘画创作等方面的压力。

AI时代,阿里云承担重任

阿里云是阿里巴巴在AI布局的核心引擎,提供稳定高效的AI基础设施,服务应用于各业务场景,推动创新。市场需求为阿里云AI发展提供广阔市场规模,加速AI技术的应用和普及。

阿里云在组织结构调整后精简项目制业务,砍掉硬件集成业务线并加大公共云事业招聘力度。外部竞争激烈下,阿里云需加强云服务稳定性,建立、守住优势。

国内云市场蓝海待打破

阿里云全线下调云产品官网售价,近55%最高降幅力度前所未有,为扩大公共云基数和规模。妙鸭相机等AI产品推出,市场吸引力逐渐增强,各云服务商竞争加速。

我国公共云渗透率大幅低于欧美市场,公共云市场规模巨大,发展潜力巨大。阿里云需继续提高稳定性,立足AI与公共云市场,守住优势地位。

作者:周文君

热门课程推荐

热门资讯

请绑定手机号

x
确定