发布时间:2024-07-08 15:09:49 浏览量:213次
继生成式文本大模型 Chatgpt、生成式图片Stablediffusion之后,生成式语音Text To Speech领域有了一匹黑马GPT-Sovits。这个黑马在语音效果克隆领域做得十分突出,利用小样本声音数据即可实现高度相似的声音仿真,因此备受瞩目。GitHub上的star数迅速飙升,目前已达27.2K。

无论是C端的内容生产者,还是B端用户,想要使用GPT-Sovits进行内容生产都会面临一些技术挑战。下面将介绍如何通过阿里云函数计算快速托管GPT-Sovits来解决这些挑战。
在GPT-Sovits的实践中,为了进一步探讨其价值,先聊聊生成式语音的应用场景:
以上的场景与TTS息息相关,TTS作为核心基础能力被广泛应用。要构建完整效果还需更多工程化实现和其他基础模型。
通过函数计算部署GPT-Sovits模型有两大好处:
1. 无需担心GPU服务器维护和环境配置,即可快速部署和体验模型。
2. 可充分利用函数计算按量付费、弹性伸缩等优势,为用户高效提供基于GPT-Sovits模型的文本到语音生成服务。

本方案的技术架构包括函数计算、文件存储NAS和专有网络VPC。
重要:
1. 阿里云不对第三方模型的合法性、安全性、准确性承担责任。
2. 用户需自觉遵守第三方模型的用户协议、使用规范和相关法律法规,使用模型需符合相关责任。
1. 登录函数计算3.0控制台。
2. 在左侧导航栏选择应用。
3. 在应用页面选择人工智能>语音克隆生成 GPT-SoVITS,点击立即创建。
4. 在创建应用页面,选择直接部署,确保所需权限已获取,服务状态已开通,其他配置保持默认,然后点击创建应用。
5. 在活动应用创建提醒对话框中,选中函数计算FC和文件存储NAS,同意并进行部署。
6. 等待约1分钟,部署状态变为部署成功,即可开始体验应用。

部署完成后,使用DEMO声音样例,进行声音合成体验。尝试合成童年经典动画片台词:
合成操作步骤:
1. 选择默认语音模板,输入文本,点击合成语音。
2. 合成完成后,点击播放。
声音训练:
通过微调GPT-Sovits大模型,生成理想的声音。训练过程中的中间产物存储在NAS的output文件夹下。需使用默认的UVR5和ASR模型。
1. 数据预处理,上传原始声音文件进行处理。
2. 微调文本,调整原始文本内容。
3. 开始训练,开启SoVITS和GPT训练,模型存储在NAS下的对应文件夹。
4. 训练完成后,在语音克隆&推流页签刷新页面,选择训练模型,再体验合成语音。
若需了解更多,请使用钉钉进入“阿里函数计算官网客户2群”(群号:64970014484)。
相关链接:
[1] GPT-Sovits:https://github.com/RVC-Boss/GPT-SoVITS
[2] 函数计算3.0控制台:https://fcnext.console.aliyun.com/
[3] 官方README:https://github.com/RVC-Boss/GPT-SoVITS/blob/main/docs/cn/README.md
热门资讯
1. 华为手机神奇“AI修图”功能,一键消除衣服!原图变身大V领深V!
最近华为手机Pura70推出的“AI修图”功能引发热议,通过简单操作可以让照片中的人物换装。想了解更多这款神奇功能的使用方法吗?点击查看!
近年来,人工智能逐渐走入公众视野,其中的AI图像生成技术尤为引人注目。只需在特定软件中输入关键词描述语以及上传参考图就能智能高效生成符合要求的...
想将照片变成漫画效果?这篇文章分享了4个方法,包括Photoshop、聪明灵犀、VanceAI Toongineer、醒图,简单操作就能实现,快来尝试一下吧!
4. 一款免费无限制的AI视频生成工具火了!国内无障碍访问!附教程
人人都可以动手制作AI视频! 打开网址https://pixverse.ai/,用邮箱注册后,点击右上角Create,就可以开始创作了。 PixVerse目前有文案生成视频,和图片生...
以下是一些免费的AI视频制作网站或工具,帮助您制作各种类型的视频。 1. Lumen5:Lumen5是一个基于AI的视频制作工具,可将文本转换为视频。 用户可以使...
6. 零基础10分钟生成漫画,教大家如何用AI生成自己的漫画
接下来,我将亲自引导你,使用AI工具,创作一本既有趣又能带来盈利的漫画。我们将一起探索如何利用这个工具,发挥你的创意,制作出令人惊叹的漫画作品。让...
就能快速生成一幅极具艺术效果的作品,让现实中不懂绘画的人也能参与其中创作!真的超赞哒~趣趣分享几款超厉害的AI绘画软件,提供详细操作!有需要的快来...
8. AI视频制作神器Viggle:让静态人物动起来,创意无限!
Viggle AI是一款免费制作视频的AI工具,能让静态人物图片动起来,快来了解Viggle AI的功能和优势吧!
9. Logo Diffusion——基于sd绘画模型的AI LOGO 生成器
这下LOGO设计彻底不用求人了。接下来详细演示一遍操作流程首先进入Logo D... 想学习更多AI技能,比如说关于怎么样利用AI来提高生产效率、还能做什么AI...
10. 10个建筑AI工具,从设计到施工全覆盖!肯定有你从来没听过的
讲述了建筑业比较著名的AI公司小库科技做出的探索,在这儿就不多说了。今天,我们试着在规划设计、建筑方案设计、住宅设计、管道设计、出渲染图、3D扫...
最新文章
同学您好!