当前位置: 首页 > news >正文

江阳建设集团网站浙江东阳市网站建设公司

江阳建设集团网站,浙江东阳市网站建设公司,浙江诚峰建设工程有限公司网站,南宁网站建设免费推广语音识别教程#xff1a;Whisper 一、前言 最近看国外教学视频的需求#xff0c;有些不是很适应#xff0c;找了找AI字幕效果也不是很好#xff0c;遂打算基于Whisper和GPT做一个AI字幕给自己。 二、具体步骤 1、安装FFmpeg Windows: 进入 https://github.com/BtbN/FF…语音识别教程Whisper 一、前言 最近看国外教学视频的需求有些不是很适应找了找AI字幕效果也不是很好遂打算基于Whisper和GPT做一个AI字幕给自己。 二、具体步骤 1、安装FFmpeg Windows: 进入 https://github.com/BtbN/FFmpeg-Builds/releases点击 windows版本的FFMPEG对应的图标进入下载界面点击 download 下载按钮。 解压下载好的zip文件到指定目录(放到你喜欢的位置) 将解压后的文件目录中 bin 目录包含 ffmpeg.exe 添加进 path 环境变量中 DOS 命令行输入 ffmpeg -version, 出现以下界面说明安装完成 2、安装Whisper模型 运行以下程序会自动安装Whisper-small的模型并识别音频audio.mp3 输出识别到的文本。如果没有科学上网的手段请手动下载 import whisper model whisper.load_model(small) result model.transcribe(audio.mp3) print(result[text])运行结果如下 三、其他 实时录制音频并转录 import pyaudio import wave import numpy as np from pydub import AudioSegment from audioHandle import addAudio_volume,calculate_volume from faster_whisper import WhisperModelmodel_size large-v3# Run on GPU with FP16 model WhisperModel(model_size, devicecuda, compute_typefloat16)def GetIndex():p pyaudio.PyAudio()# 要找查的设备名称中的关键字target 立体声混音for i in range(p.get_device_count()):devInfo p.get_device_info_by_index(i)# if devInfo[hostApi] 0:if devInfo[name].find(target) 0 and devInfo[hostApi] 0:print(devInfo)print(devInfo[index])return devInfo[index]return -1 # 配置 FORMAT pyaudio.paInt16 # 数据格式 CHANNELS 1 # 声道数 RATE 16000 # 采样率 CHUNK 1024 # 数据块大小 RECORD_SECONDS 5 # 录制时长 WAVE_OUTPUT_FILENAME output3.wav # 输出文件 DEVICE_INDEX GetIndex() # 设备索引请根据您的系统声音设备进行替换 if DEVICE_INDEX-1:print(请打开立体声混音) audio pyaudio.PyAudio()# 开始录制 stream audio.open(formatFORMAT, channelsCHANNELS,rateRATE, inputTrue,frames_per_bufferCHUNK, input_device_indexDEVICE_INDEX) data stream.read(CHUNK) print(recording...)frames []moreDatas[] maxcount3 count0 while True:# 初始化一个空的缓冲区datas []for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):data stream.read(CHUNK)audio_data np.frombuffer(data, dtypenp.int16)datas.append(data)# 计算音频的平均绝对值volume np.mean(np.abs(audio_data))# 将音量级别打印出来print(音量级别:, volume)moreDatas.append(datas)if len(moreDatas)maxcount:moreDatas.pop(0)newDatas[i for j in moreDatas for i in j]buffersbfor buffer in newDatas:buffersbufferprint(开始识别)buffersnp.frombuffer(buffers, dtypenp.int16)# a np.ndarray(buffernp.array(datas), dtypenp.int16, shape(CHUNK,))segments, info model.transcribe(np.array(buffers), languageen)textfor segment in segments:print([%.2fs - %.2fs] %s % (segment.start, segment.end, segment.text))textsegment.textprint(text) print(finished recording)# 停止录制 stream.stop_stream() stream.close() audio.terminate()# 保存录音 wf wave.open(WAVE_OUTPUT_FILENAME, wb) wf.setnchannels(CHANNELS) wf.setsampwidth(audio.get_sample_size(FORMAT)) wf.setframerate(RATE) wf.writeframes(b.join(frames)) wf.close()#addAudio_volume(WAVE_OUTPUT_FILENAME)
http://www.zqtcl.cn/news/564847/

相关文章:

  • 搭建网站需要什么软件苏州吴中区建设局工程网站
  • 长沙市网站推广公司wordpress 弹窗登录插件
  • 网站策划怎么做内容朔州网站建设公司
  • 宁波拾谷网站建设蚌埠网站建设中心
  • 青岛专业设计网站公司加拿大广播公司
  • 盘锦市建设局网站地址八桂职教网技能大赛
  • 投资建设一个网站多少钱和淘宝同时做电商的网站
  • 做动物网站的素材icp备案 网站备案
  • 找人建网站唐山网络运营推广
  • 福建省住房建设厅网站6网站简历模板
  • 医疗网站模版杭州工商注册
  • 正保建设工程网站logo创意
  • 简洁个人博客网站模板下载用自己电脑做网站服务器-phpstudy+花生壳
  • 网页模板下载哪个网站好多个域名指定同一个网站好处
  • 北京网站建设有哪些公司微网站的案例
  • 常德经开区网站官网域名备案关闭网站吗
  • 做宠物网站的工作室做网站租服务器
  • 2017做那个网站致富网站换源码如何保留以前的文章
  • php网站开发实例教程书wordpress博客页面显示文章在哪
  • 地方o2o同城网站源码微信app开发价格表
  • 花木公司网站源码双语外贸网站源码
  • 什么公司做网站会提供源代码创业做招商加盟类网站赚钱
  • 东莞网站建设排名基因数据库网站开发价格
  • 天河区营销型网站建设科技自立自强
  • 网站域名账号江苏百度推广代理商
  • 专题网站建站对网站分析
  • 外贸出口网站建设如何搭建自己的网站服务器
  • 云南省建设厅网站职称评审房地产推广方案和推广思路
  • 湘潭建设路街道网站app的设计与开发
  • 《网站开发实践》 实训报告广告策划书案例完整版