开源好项目推荐 | AI拟声:克隆声音生成新语音

发布时间:2024-07-20 20:22:35 浏览量:226次

开源好项目介绍

《开源精选》是我们分享Github、Gitee等开源社区中优质项目的栏目,包括技术、学习、实用与各种有趣的内容。本期推荐的是一个基于Python的AI拟声项目——MockingBird。

MockingBird简介

MockingBird可以通过5秒钟的音频素材克隆声音,生成的新声音与原始声音非常相似,并且能够合成原始音频样本中不存在的声音和辅音,同时也支持生成任意语音内容。

MockingBird

MockingBird特性

  • 中文支持普通话,使用多种中文数据集进行测试
  • 基于PyTorch,支持最新版本,适用于GPU Tesla T4 和 GTX 2060
  • 可在Windows和Linux操作系统中运行
  • 提供Easy & Awesome下载器和新训练合成器,使用HiFi-GAN作为声码器
  • 支持将训练结果部署至Web服务器供远程调用

如何使用MockingBird

  1. 安装:
    • 安装PyTorch
    • 安装ffmpeg
    • 运行指令安装必要的包
    • 安装webrtcvad
  2. 准备预训练模型:
    • 自行训练合成器模型
    • 或使用社区预先训练好的合成器
    • 训练声码器(可选)
  3. 启动程序或工具箱:
    • 启动Web程序
    • 启动工具箱

更多内容请前往阅读。

Web程序启动
工具箱启动

欲了解更多MockingBird项目信息,请访问 MockingBird项目地址

关于我们

欢迎了解更多数字艺术教育课程,请点击 点击咨询 进行报名或咨询。

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定