网站制作方案垂直领域获客,怎么注册网站免费的吗,网站建站过程分析,企业网站管理系统湖南岚鸿为什么选它#xff1f;
克隆有很多#xff0c;为什么选它#xff0c;它是中国人做的#xff0c;阿里达摩院#xff0c;5分钟音频数据集就够了。
国内做的有什么好处#xff0c;因为大家都是中国人#xff0c;说的是中国话#xff0c;技术最大的难题不是基础#xff…为什么选它
克隆有很多为什么选它它是中国人做的阿里达摩院5分钟音频数据集就够了。
国内做的有什么好处因为大家都是中国人说的是中国话技术最大的难题不是基础而是语言与环境咱们在国内可以问作者好沟通。 2种方法
modelscope和kantts版官方推荐的是modelscope我推荐的是kantts。
为什么?modelscope整个包有30g集成了很多不需要的东西而且每次使用他会从网上下载一些其他的东西哪天不让你用了就挂了。而kantts是他开源的版本只有语音本身虽然比modelscope复杂会遇到很多问题但是他是最小的并且可以纯离线使用的。复杂你也不用担心因为我会帮你。
kantts使用前检查
首先检查你的cpu架构如果cpu不支持这个指令集那么就没必要往后看了。
x86_64架构
uname -m
cpu支持avx2指令集
cat /proc/cpuinfo | grep avx2
如果什么都没有弹出那就是不支持了 安装
首先安装conda
ubuntu安装python以及conda-CSDN博客
gpu以及cuda驱动安装 #安装显卡驱动 sudo apt-get update sudo apt-get install gcc sudo apt-get install makescp mqq192.168.51.132:/home/mqq/NVIDIA-Linux-x86_64-535.98.run /home/mqq/NVIDIA-Linux-x86_64-535.98.run--------自己从网上下载 sudo sh NVIDIA-Linux-x86_64-535.98.run nvidia-smi sudo apt purge nvidia-driver* sudo apt install nvidia-driver-535scp mqq192.168.51.132:/home/mqq/cuda_12.2.1_535.86.10_linux.run /home/mqq/cuda_12.2.1_535.86.10_linux.run ----网上自己下载 sudo sh cuda_12.2.1_535.86.10_linux.run --silent --toolkit sudo sh cuda_12.2.1_535.86.10_linux.run nvcc -V clone他的开源项目 git clone https://github.com/alibaba-damo-academy/KAN-TTS.git 进入tts里面发现有一个environment pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simpleconda env create -f environment.yaml 如果报错了他会回滚全部的建议一个一个安装写到request.txt里面发现哪个报错了先把他删掉后面单独下载到本地找资源和换网都行然后上传上去。 如果你在国外那你可以下载下来如果你在国内由于网络原因部分包下载不下来。
此时就要切换镜像源。当然切完之后你依然有部分包下载不下来。 这2个包要自己本地弄下来然后手动安装好然后在上传上去。 然后就能得到了一个maas的包了但是你哥我呢特别贴心。给你做好了maas的conda环境。
你只要把下载下来解压到你的conda目录你就拥有了maas的python环境。 然后就可以训练了
训练
切分
首先准备一堆数据集用我的切分方法将音频切分成3-15秒的
对音频切分成小音频机器学习用_我要用代码向我喜欢的女孩表白的博客-CSDN博客
数据标注
通过modelscope的autolabel方法变成他能够处理的格式数据
此时要最小安装pip install modelscope这个包很小不超过100mb
有时候可能下载很慢你也可以windows下载下来然后本地上传上去。
执行标注的代码
还要装这个包 pip install tts-autolabel -f https://modelscope.oss-cn-beijing.aliyuncs.com/releases/repo.html 然后执行他就在下载一个700mb的东西下面我看源码把他这个下载的删除每次都要下载
代码记得改路径
这个是run_auto_label.py
# -*- coding: utf-8 -*-
from modelscope.tools import run_auto_label
import osdef training_model(model_name):input_wav ./output/model_name # wav audio pathwork_dir ./lableOutput/model_name # output pathos.makedirs(work_dir, exist_okTrue)ret, report run_auto_label(input_wav input_wav,work_dir work_dir,resource_revision v1.0.7)print(report)print(样本分词完成,准备训练模型,模型名称: model_name)print(# ## ##### ###### # #### # # )print(# # # # # # # # # # # )print(# # # ##### ##### # # # #### )print(# ###### # # # # # # # # )print(# # # # # # # # # # # )print(###### # # ##### ###### ###### #### # # )if __name__ __main__:training_model(douBao) 本地也要安装sox
sudo apt install sox 然后执行代码
python run_auto_label.py 数据预处理
先安装
pip install pyyaml
pip install tqdm
pip install sox
pip install pysptk
pip install torch
python /自己tts目录/KAN-TTS/kantts/preprocess/data_process.py --voice_input_dir 刚刚生成的标注的目录 --voice_output_dir 预处理的目录 --audio_config /自己tts目录/KAN-TTS/kantts/configs/audio_config_24k.yaml --speaker 人物名称随便起
audio_config_24k.yaml这个我训练的是24k的音质还有16k以及其他的