语义识别的难点在哪和特征参数提取技术

　　语义差别量表需要挑选一些能够形容评分概念的一系列对立的形容词或短语，每组形容词代表评分的两个极端条件李克特量表避免了设计对立形容词的难题，这种量表有一系列能够表达对所研究的概念是肯定还是否定态度的陈述所构成。

　　做好嘈杂环境的语音识别，难点是如何将杂音与人声分离，传统的音频识别需要人工设计模块，并依靠HiddenMarkovModels，常常需要大量的人力和经验来调整模型噪音和语音变异，未来的主要研究方向是，通过深度学习来替代HiddenMarkovModels，如基于递归神经网络的深度神经网络（DNN）进行声学建模，使得语音识别系统变得更为简单，日立公司宣称自己已经研发出一项新技术，利用对话音量比杂音变化较少的特点，将杂音与话音进行分离。

　　语音识别和语义识别的区别是什么。

　　“语音识别”是从音频中识别出文字，也就是常说的音频转文字，例如输入法：你读一段话，显示出文字用的就是语音识别技术。

　　“语义识别”大家说的是“语义理解”，NLP，对文字内容进行理解，识别出意图。

　　语音识别比语义识别更好实现吗。

　　语义识别会更好一些，因为返回的是拼音，这样我们就不会认为是错别字，拼音作为相似，更容易触发指令，而语音识别出来的是中文，这个时候如果有口音之类的，错误率就会比较高。

　　语音信号中含有丰富的信息，但如何从中提取出对语音识别有用的信息呢，特征提取就是完成这项工作，它对语音信号进行分析处理，去除对语音识别无关紧要的冗余信息，获得影响语音识别的重要信息，对于非特定人语音识别来讲，希望特征参数尽可能多的反映语义信息，尽量减少说话人的个人信息(对特定人语音识别来讲，则相反)，从信息论角度讲，这是信息压缩的过程。

　　线性预测(LP)分析技术是目前应用广泛的特征参数提取技术，许多成功的应用系统都采用基于LP技术提取的倒谱参数，但线性预测模型是纯数学模型，没有考虑人类听觉系统对语音的处理特点。

　　Mel参数和基于感知线性预测(PLP)分析提取的感知线性预测倒谱，在一定程度上模拟了人耳对语音的处理特点，应用了人耳听觉感知方面的一些研究成果，实验证明，采用这种技术，语音识别系统的性能有一定提高。

　　也有研究者尝试把小波分析技术应用于特征提取，但目前性能难以与上述技术相比，有待进一步研究。

数字人产品

客户联络中心

移动通信

私有化AI能力

对话能力

语音能力

语义能力

图像能力

视频能力

视觉能力

帮助文档

帮助中心

知识社区

接口文档

视频教程

资讯

关于我们

相关文章

主营产品

相关登录

技术探索

使用帮助

关于我们