手机网站 自适应,app优化方案,wordpress注册修改密码,wordpress 迁移 空白PaddleSpeech 介绍
PaddleSpeech是百度飞桨#xff08;PaddlePaddle#xff09;开源深度学习平台的其中一个项目#xff0c;它基于飞桨的语音方向模型库#xff0c;用于语音和音频中的各种关键任务的开发#xff0c;包含大量基于深度学习前沿和有影响力的模型。PaddleSpe…PaddleSpeech 介绍
PaddleSpeech是百度飞桨PaddlePaddle开源深度学习平台的其中一个项目它基于飞桨的语音方向模型库用于语音和音频中的各种关键任务的开发包含大量基于深度学习前沿和有影响力的模型。PaddleSpeech支持语音识别、语音翻译英译中、语音合成、标点恢复等应用示例。
安装paddlespeech
PaddleSpeech 快速安装方式有两种一种是 pip 安装一种是源码编译官方推荐。
使用pip安装paddlespeech
$ pip install pytest-runner
$ pip3 install paddleaudio1.0.1
$ pip3 install paddlespeech1.0.1使用源码编译安装
$ git clone https://github.com/PaddlePaddle/PaddleSpeech.git
$ cd PaddleSpeech
$ pip install pytest-runner
$ pip install .提示安装过程可能因为缺少各种的库报错如librosa 依赖的系统库gcc 环境问题kaldi 安装等可以在网上查找。 音频示例下载
$ wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav
$ wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav基本使用
语音合成 $ paddlespeech tts --input 你好欢迎使用百度飞桨深度学习框架 --output output.wav$ paddlespeech tts --input 你好税软 --output sr.wav如果报错
$ pip install numpy1.23.0
$ sudo apt-get install libsndfile1执行过程
$ ts-paddle /paddle/PaddleSpeech paddlespeech tts --input 你好欢迎使用百度飞桨深度学习框架 --output output.wav
grep: warning: GREP_OPTIONS is deprecated; please use an alias or script
/usr/local/lib/python3.7/dist-packages/librosa/core/constantq.py:1059: DeprecationWarning: np.complex is a deprecated alias for the builtin complex. To silence this warning, use complex by itself. Doing this will not modify any behavior and is safe. If you specifically wanted the numpy scalar type, use np.complex128 here.
Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecationsdtypenp.complex,
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 489M/489M [01:0100:00, 7.96MB/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 915M/915M [01:5100:00, 8.22MB/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 589M/589M [01:0100:00, 9.57MB/s]
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 107k/107k [00:0000:00, 1.33MB/s]
W0606 13:22:41.408085 2451 gpu_resources.cc:61] Please NOTE: device: 0, GPU Compute Capability: 7.5, Driver API Version: 11.7, Runtime API Version: 11.7
W0606 13:22:41.412684 2451 gpu_resources.cc:91] device: 0, cuDNN Version: 8.4.
/paddle/PaddleSpeech/output.wavλ ts-paddle /paddle/PaddleSpeech ls
语音识别
识别中文
$ paddlespeech asr --lang zh --input zh.wav指定模型识别识别英文
$ paddlespeech asr --lang en --model deepspeech2offline_librispeech --input en.wav标点恢复
恢复文本标点可与ASR模型配合使用
$ paddlespeech text --task punc --input 今天的天气真不错啊你下午有空吗我想约你一起去吃饭声音分类
适配多场景的开放领域声音分类工具 基于 AudioSet 数据集 527 个类别的声音分类模型
$ paddlespeech cls --input zh.wav声纹提取
工业级声纹提取工具
$ paddlespeech vector --task spk --input zh.wav语音翻译
端到端英译中语音翻译工具,使用预编译的 kaldi 相关工具只支持在 Ubuntu 系统中体验
$ paddlespeech st --input en.wav