当前位置: 首页 > news >正文

榆林网站开发无锡企业制作网站

榆林网站开发,无锡企业制作网站,电脑网站建设在哪里,自己弄个网站要多少钱说明#xff1a;该系列文章从本人知乎账号迁入#xff0c;主要原因是知乎图片附件过于模糊。 知乎专栏地址#xff1a; 语音生成专栏 系列文章地址#xff1a; 【GPT-SOVITS-01】源码梳理 【GPT-SOVITS-02】GPT模块解析 【GPT-SOVITS-03】SOVITS 模块-生成模型解析 【G…说明该系列文章从本人知乎账号迁入主要原因是知乎图片附件过于模糊。 知乎专栏地址 语音生成专栏 系列文章地址 【GPT-SOVITS-01】源码梳理 【GPT-SOVITS-02】GPT模块解析 【GPT-SOVITS-03】SOVITS 模块-生成模型解析 【GPT-SOVITS-04】SOVITS 模块-鉴别模型解析 【GPT-SOVITS-05】SOVITS 模块-残差量化解析 【GPT-SOVITS-06】特征工程-HuBert原理 1.概述 GPT-SOVITS 的 GPT模块式实现从文本到语音编码的过程。 GPT-SOVITS 在原有的SOVITS入口加了一个残差量化层参考Vall-E这个量化层的输入是包含音频的文本特征和音色特征的。 AR模块的核心就是训练得到一个可以将文本转换成这个量化器输入的模型。核心代码主要在 AR包下 t2s_model.py 的 Text2SemanticDecoder类中。 训练特征包括 2.训练流程 这里 semantic 是利用音频的 hubert 自编码信息SSL进入 sovits 的残差量化层输出的结果这个特征是包含文本以及音色特征phoneme 特征和berf特征是针对文本的音素特征类似拼音 3.推理流程 推理时phoneme和berf用的是待生成的文本特征semantic 是参考音频生成的编码特征推理时以参考音频为起点基于文本特征逐次向后预测 semantic编码直到结束因此返回的结果相当于两段的拼接因此直接截取即可 4.调试代码参考 import os,sys import yaml,torch sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))from vof.ar.model.t2s_model import Text2SemanticDecoder from vof.ar.data.data_module import Text2SemanticDataModulenow_dir os.getcwd() root_dir os.path.dirname(now_dir) prj_name project01 # 项目名称 prj_dir root_dir /res/ prj_name /with open(root_dir /res/configs/s1longer.yaml) as f:data f.read()data yaml.load(data, Loaderyaml.FullLoader)s1_dir prj_dir logs os.makedirs(%s/logs_s1 % (s1_dir), exist_okTrue)data[train][batch_size] 3 data[train][epochs] 15 data[pretrained_s1] root_dir /res/pretrained_models/s1bert25hz-2kh-longer-epoch68e-step50232.ckpt data[train][save_every_n_epoch] 5 data[train][if_save_every_weights] True data[train][if_save_latest] True data[train][exp_name] prj_name data[train][half_weights_save_dir] root_dir /res/weight/gpt data[train_semantic_path] %s/6-name2semantic.tsv % s1_dir data[train_phoneme_path] %s/2-name2text-0.txt % s1_dir data[train_bert_path] %s/3-bert % s1_dir data[output_dir] %s/logs_s1 % s1_dirText2SemanticDataModule Text2SemanticDataModule(data,train_semantic_path data[train_semantic_path],train_phoneme_path data[train_phoneme_path],train_bert_path data[train_bert_path])Text2SemanticDataModule.setup() print(Text2SemanticDataModule._train_dataset.__getitem__(0)) phoneme_ids: 文本转换为音素后继续转换为 音素的编码 对应 name2text phoneme_ids_len音素数据长度 semantic_ids语音编码对应 name2semantic semantic_ids_len语音编码数据长度 bert_featurebert 文本特征 t2smodel Text2SemanticDecoder(data)res Text2SemanticDataModule._train_dataset.__getitem__(0) phoneme_ids res.get(phoneme_ids) phoneme_ids_len res.get(phoneme_ids_len) semantic_ids res.get(semantic_ids) semantic_ids_len res.get(semantic_ids_len) bert_feature res.get(bert_feature)# 增加一个batch 维度 x torch.LongTensor(phoneme_ids).unsqueeze(0) x_len torch.LongTensor([phoneme_ids_len]) y torch.LongTensor(semantic_ids).unsqueeze(0) y_len torch.LongTensor([semantic_ids_len]) bert_feature bert_feature.unsqueeze(0).float()t2smodel.forward(x,x_len, y, y_len, bert_feature)
http://www.zqtcl.cn/news/719974/

相关文章:

  • 企业网站需求文档微商引流客源最快的方法
  • 交互式网站备案业务网站在线生成
  • 自建网站百度个人网站如何在百度上做推广
  • 如何安装wordpress模板竞价网站做seo
  • 做论坛网站如何赚钱电子商务营销推广
  • 想要自己做一个网站怎么做济宁百度网站建设
  • 海会网络建设网站wordpress刷不出图片
  • 一个人做商城网站网站推广的几个阶段
  • 做国学类网站合法吗html5教程pdf下载
  • 云南省文化馆网站建设二级域名分发平台
  • 网站版面布局结构图网站收录批量查询
  • 网站开发手机模拟器常州到丹阳
  • 淮南医院网站建设班级网站开发报告
  • 东莞营销网站建设哪家好微信api接口
  • 凡科建站怎么导出网页wordpress视频采集插件
  • 个人介绍网站源码云主机上传网站
  • app推广平台网站系统登录入口
  • 做公司宣传册的网站成crm网
  • 新乡公司做网站军事新闻内容摘抄
  • 讯美智能网站建设泰安网络科技有限公司电话
  • 新泰建设局网站北京公司排名seo
  • 新网站上线wordpress用户登陆
  • 景安网站备案表格首页风格
  • 做网站卖菜刀需要什么手续互联网营销顾问
  • 山东鲁中公路建设有限公司网站电商网站建设任务分解结构
  • 王野苏婉卿乐清网站优化
  • 三亚市住房和城乡建设厅网站wordpress适合企业网站模板
  • php网站建设思路方案中国空间站组合体
  • 帝国+只做网站地图厦门app定制公司
  • 网站运营推广主要做什么的高匿代理ip