当前位置: 首页 > news >正文

网站流量监控做医药商城网站的公司

网站流量监控,做医药商城网站的公司,系统优化方法,网络销售怎么干从语音识别算法的发展来看#xff0c;语音识别技术主要分为三大类#xff0c;第一类是模型匹配法#xff0c;包括矢量量化(VQ) 、动态时间规整(DTW)等#xff1b;第二类是概率统计方法#xff0c;包括高斯混合模型(GMM) 、隐马尔科夫模型(HMM)等#xff1b;第三类是辨别器…从语音识别算法的发展来看语音识别技术主要分为三大类第一类是模型匹配法包括矢量量化(VQ) 、动态时间规整(DTW)等第二类是概率统计方法包括高斯混合模型(GMM) 、隐马尔科夫模型(HMM)等第三类是辨别器分类方法如支持向量机(SVM) 、人工神经网络(ANN)和深度神经网络DNN等多种组合方法。下面对主流的识别技术做简单介绍 动态时间规整DTW 语音识别中由于语音信号的随机性即使同一个人发的同一个音只要说话环境和情绪不同时间长度也不尽相同因此时间规整是必不可少的。DTW是一种将时间规整与距离测度有机结合的非线性规整技术在语音识别时需要把测试模板与参考模板进行实际比对和非线性伸缩并依照某种距离测度选取距离最小的模板作为识别结果输出。动态时间规整技术的引入将测试语音映射到标准语音时间轴上使长短不等的两个信号最后通过时间轴弯折达到一样的时间长度进而使得匹配差别最小结合距离测度得到测试语音与标准语音之间的距离。 支持向量机SVM 支持向量机是建立在VC维理论和结构风险最小理论基础上的分类方法它是根据有限样本信息在模型复杂度与学习能力之间寻求最佳折中。从理论上说SVM就是一个简单的寻优过程它解决了神经网络算法中局部极值的问题得到的是全局最优解。SVM已经成功地应用到语音识别中并表现出良好的识别性能。 矢量量化VQ 矢量量化是一种广泛应用于语音和图像压缩编码等领域的重要信号压缩技术思想来自香农的率-失真理论。其基本原理是把每帧特征矢量参数在多维空间中进行整体量化在信息量损失较小的情况下对数据进行压缩。因此它不仅可以减小数据存储而且还能提高系统运行速度保证语音编码质量和压缩效率一般应用于小词汇量的孤立词语音识别系统。 隐马尔科夫模型HMM 隐马尔科夫模型是一种统计模型目前多应用于语音信号处理领域。在该模型中马尔科夫(Markov)链中的一个状态是否转移到另一个状态取决于状态转移概率而某一状态产生的观察值取决于状态生成概率。在进行语音识别时HMM首先为每个识别单元建立发声模型通过长时间训练得到状态转移概率矩阵和输出概率矩阵在识别时根据状态转移过程中的最大概率进行判决。 高斯混合模型GMM 高斯混合模型是单一高斯概率密度函数的延伸GMM能够平滑地近似任意形状的密度分布。高斯混合模型种类有单高斯模型Single Gaussian Model, SGM和高斯混合模型Gaussian Mixture Model, GMM两类。类似于聚类根据高斯概率密度函数Probability Density Function, PDF参数不同每一个高斯模型可以看作一种类别输入一个样本x即可通过PDF计算其值然后通过一个阈值来判断该样本是否属于高斯模型。很明显SGM适合于仅有两类别问题的划分而GMM由于具有多个模型划分更为精细适用于多类别的划分可以应用于复杂对象建模。目前在语音识别领域GMM需要和HMM一起构建完整的语音识别系统。 人工神经网络ANN/BP 人工神经网络由20世纪80年代末提出其本质是一个基于生物神经系统的自适应非线性动力学系统它旨在充分模拟神经系统执行任务的方式。如同人的大脑一样神经网络是由相互联系、相互影响各自行为的神经元构成这些神经元也称为节点或处理单元。神经网络通过大量节点来模仿人类神经元活动并将所有节点连接成信息处理系统以此来反映人脑功能的基本特性。尽管ANN模拟和抽象人脑功能很精准但它毕竟是人工神经网络只是一种模拟生物感知特性的分布式并行处理模型。ANN的独特优点及其强大的分类能力和输入输出映射能力促成在许多领域被广泛应用特别是在语音识别、图像处理、指纹识别、计算机智能控制及专家系统等领域。但从当前语音识别系统来看由于ANN对语音信号的时间动态特性描述不够充分大部分采用ANN与传统识别算法相结合的系统。 深度神经网络/深信度网络-隐马尔科夫DNN/DBN-HMM 当前诸如ANN、BP等多数分类的学习方法都是浅层结构算法与深层算法相比存在局限。尤其当样本数据有限时它们表征复杂函数的能力明显不足。深度学习可通过学习深层非线性网络结构实现复杂函数逼近表征输入数据分布式并展现出从少数样本集中学习本质特征的强大能力。在深度结构非凸目标代价函数中普遍存在的局部最小是训练效果不理想的主要根源。为了解决以上问题提出基于深度神经网络(DNN) 的非监督贪心逐层训练算法它利用空间相对关系减少参数数目以提高神经网络的训练性能。相比传统的基于GMM-HMM的语音识别系统其最大的改变是采用深度神经网络替换GMM模型对语音的观察概率进行建模。最初主流的深度神经网络是最简单的前馈型深度神经网络Feedforward Deep Neural NetworkFDNN。DNN相比GMM的优势在于1. 使用DNN估计HMM的状态的后验概率分布不需要对语音数据分布进行假设2. DNN的输入特征可以是多种特征的融合包括离散或者连续的3. DNN可以利用相邻的语音帧所包含的结构信息。基于DNN-HMM识别系统的模型如图2所示。 循环神经网络RNN 语音识别需要对波形进行加窗、分帧、提取特征等预处理。训练GMM时候输入特征一般只能是单帧的信号而对于DNN可以采用拼接帧作为输入这些是DNN相比GMM可以获得很大性能提升的关键因素。然而语音是一种各帧之间具有很强相关性的复杂时变信号这种相关性主要体现在说话时的协同发音现象上往往前后好几个字对我们正要说的字都有影响也就是语音的各帧之间具有长时相关性。采用拼接帧的方式可以学到一定程度的上下文信息。但是由于DNN输入的窗长是固定的学习到的是固定输入到输入的映射关系从而导致DNN对于时序信息的长时相关性的建模是较弱的。 考虑到语音信号的长时相关性一个自然而然的想法是选用具有更强长时建模能力的神经网络模型。于是循环神经网络Recurrent Neural NetworkRNN近年来逐渐替代传统的DNN成为主流的语音识别建模方案。如图3相比前馈型神经网络DNN循环神经网络在隐层上增加了一个反馈连接也就是说RNN隐层当前时刻的输入有一部分是前一时刻的隐层输出这使得RNN可以通过循环反馈连接看到前面所有时刻的信息这赋予了RNN记忆功能。这些特点使得RNN非常适合用于对时序信号的建模。 长短时记忆模块LSTM 长短时记忆模块 (Long-Short Term MemoryLSTM) 的引入解决了传统简单RNN梯度消失等问题使得RNN框架可以在语音识别领域实用化并获得了超越DNN的效果目前已经使用在业界一些比较先进的语音系统中。除此之外研究人员还在RNN的基础上做了进一步改进工作如图4是当前语音识别中的主流RNN声学模型框架主要包含两部分深层双向RNN和序列短时分类Connectionist Temporal ClassificationCTC输出层。其中双向RNN对当前语音帧进行判断时不仅可以利用历史的语音信息还可以利用未来的语音信息从而进行更加准确的决策CTC使得训练过程无需帧级别的标注实现有效的“端对端”训练。 卷积神经网络CNN CNN早在2012年就被用于语音识别系统并且一直以来都有很多研究人员积极投身于基于CNN的语音识别系统的研究但始终没有大的突破。最主要的原因是他们没有突破传统前馈神经网络采用固定长度的帧拼接作为输入的思维定式从而无法看到足够长的语音上下文信息。另外一个缺陷是他们只是将CNN视作一种特征提取器因此所用的卷积层数很少一般只有一到二层这样的卷积网络表达能力十分有限。针对这些问题提出了一种名为深度全序列卷积神经网络Deep Fully Convolutional Neural NetworkDFCNN的语音识别框架使用大量的卷积层直接对整句语音信号进行建模更好地表达了语音的长时相关性。DFCNN它直接将一句语音转化成一张图像作为输入即先对每帧语音进行傅里叶变换再将时间和频率作为图像的两个维度然后通过非常多的卷积层和池化pooling层的组合对整句语音进行建模输出单元直接与最终的识别结果比如音节或者汉字相对应。 识别技术的发展方向 更有效的序列到序列直接转换的模型。序列到序列直接转换的模型目前来讲主要有两个方向一是CTC模型二是Attention 模型。 鸡尾酒会问题远场识别。这个问题在近场麦克风并不明显这是因为人声的能量对比噪声非常大而在远场识别系统上信噪比下降得很厉害所以这个问题就变得非常突出成为了一个非常关键、比较难解决的问题。鸡尾酒会问题的主要困难在于标签置换Label Permutation目前较好的解决方案有二一是深度聚类Deep Clustering二是置换不变训练Permutation invariant Training。 持续预测与自适应模型。能否建造一个持续做预测并自适应的系统。它需要的特点一个是能够非常快地做自适应并优化接下来的期望识别率。另一个是能发现频度高的规律并把这些变成模型默认的一部分不需要再做训练。前后端联合优化。前端注重音频质量提升后端注重识别性能和效率提升。
http://www.zqtcl.cn/news/431783/

相关文章:

  • 用html5做手机网站抖音平台建站工具
  • 在线课程网站开发的研究意义网站开发需要哪些知识
  • 深圳网站优化怎么做手工艺品外贸出口公司网站建设方案
  • 从网站优化之角度出发做网站策划wordpress邀请码插件
  • 大学营销型网站建设实训课程o2o的四种营销模式
  • 咋做网站代码背景图宁远网站建设
  • 有哪些可以做网站的企业网站想换个风格怎么做
  • 怎么在百度搜索自己的网站在电脑上建设个人网站
  • wordpress网站菜单固定电商未来发展趋势前景
  • 五合一网站建设费用python 做网站 用哪个框架好
  • 波莱网站开发动态域名可以做网站吗
  • 网站建设 赣icp 南昌面馆装修设计
  • 福田附近公司做网站建设多少钱网站建设文献综述范文
  • 镇江网站建设设计建设银行投诉网站首页
  • 石家庄个人做网站广州全网络营销
  • html5网站建设加盟wordpress 4.8.6
  • 携程网站建设的基本特点哈尔滨做平台网站平台公司
  • 网站建设入门解读国模 wordpress
  • 网站购物车js代码怎么做制作app的软件有哪些
  • 36氪网站用什么程序做的互联网门户网站建设
  • 视频聚合网站怎么做不侵权wordpress 管理员插件
  • 传媒网站后台免费模板网站建设的进度计划
  • 如何做网站排名合肥全网优化
  • 网站建设招聘信息官网 wordpress
  • 城阳网站开发公司网页制作与设计在哪搜题
  • 做网站算运营吗grace wordpress
  • 厦门建设网站建站制作网页动画的软件
  • 百度提交网站收录入口郑州网站app开发
  • 自己的身份已经网站备案了品牌建设目标包括哪些方面
  • 中国免费网站服务器下载保定网站制作系统