锡林郭勒盟建设工程造价信息管理网站,百度做的网站能优化吗,wordpress首页页面,天津软件定制开发Whisper 是一种通用的语音识别模型。 它是OpenAI于2022年9月份开源的在各种音频的大型数据集上训练的语音识别模型#xff0c;也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。 GitHub - yeyupiaoling/Whisper-Finetune: 微调Whisper语音识别模型和加速推理…Whisper 是一种通用的语音识别模型。 它是OpenAI于2022年9月份开源的在各种音频的大型数据集上训练的语音识别模型也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。 GitHub - yeyupiaoling/Whisper-Finetune: 微调Whisper语音识别模型和加速推理支持Web部署和Android部署
Whisper Webui - a Hugging Face Space by aadnk
微调Whisper语音识别模型和加速推理_夜雨飘零1的博客-CSDN博客
Openai-Whisper识别生成语音/视频字幕文件支持自动翻译 - 哔哩哔哩
Whisper OpenAI开源语音识别模型_开源语音识别算法_Sanfor的博客-CSDN博客
conda create -n whisper python3.9
conda activate whisper
pip install githttps://github.com/openai/whisper.git
whisper audio.mp3 --model medium --language Chinese 解决输出繁体中文不输出简体中文问题
whisper --language Chinese --model large audio.mp3 --initial_prompt 以下是 普通话句子 就中文而言Whisper各模型
tiny 是没有做断句的或者说直接根据停顿断句base 已经开始根据逻辑断句但会出语法错误small 已经很少语法错误但断句水平却直线下降很奇怪medium 不仅能够完美的断句还能判断语气
可以看出飞书妙记给用户开放的转写能力大约在 tiny 到 base 之间转写速度也在 tiny 左右已经很快了
值得指出的是这里的对比目的并不是比较二者的技术否则对于飞书妙计相当的不公平作为一款消费级应用它不可能给用户跑medium等级的模型来做转写
对比的意义是Whisper作为一个开源模型和消费级产品比起来怎么样
答案是完全可以替代用 small 模型足以实现当下的免费体验了。
甚至用 medium 以上的模型可以用「时间」换「好得多的使用体验」 Whisper—通用的语音识别模型 - 知乎 https://www.bilibili.com/read/cv19254244
openai开源的whisper在huggingface中使用例子语音转文字中文_语音识别_qq_37401291-开发者创业生态社区 OpenAI 开源音频转文字模型 Whisper 尝鲜 - 少数派 Whisper—通用的语音识别模型 - 知乎 https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/demos/speech_web
OpenAI 开源语音识别模型 Whisper - OSCHINA - 中文开源技术交流社区 OpenAI Whisper中文语音识别效果尝试和应用一_迷途的小朋友的博客-CSDN博客
GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision
OpenAI Whisper中文语音识别效果尝试和应用一_迷途的小朋友的博客-CSDN博客