电脑基础 · 2023年3月31日

基于MockingBird声音克隆

Mockingbird 是一种声音克隆软件,可以复制和编辑人类语音。这种软件通常用于语音模拟和生成新语音,但也可能用于欺骗和恶作剧。由于技术的进步,声音克隆软件越来越逼真,因此应谨慎使用。

目前网络上的版本有很多,教程也是各种五花八门,我尝试看了几个代码都跑不通,自己折腾了一天终于完成了数据集预处理、模型训练应用的过程,效果还算可以,想要真的完美的克隆声音还需要技术的进步才可以。

文章目录

  • 准备工作
  • 环境配置
    • 创建虚拟环境
    • 激活虚拟环境
    • pip安装匹配版本
  • 声音克隆
    • 音频数据批量预处理
    • 长音频截取功能
    • 模型数据预处理
    • 训练encoder模型 (可选)
    • 训练合成器模型
    • 查看训练模型
    • GUI可视化操作
  • 已知的bug和解决办法
    • 文字目录没有配置好
    • 数据目录没有配置好
    • 其他的可以留言我会补充解决办法