人工智能语义识别算法与语音信号预处理

  人工智能是一个包含很多学科的交叉学科,你需要了解计算机的知识,信息论,控制论,图论,心理学,生物学,热力学,你要有一定的哲学基础,有科学方法论作保障,这些学科的每一门都是博大精深的,但同时很多事物都是相通的,你学了很多知识有了一定的基础的时候再看相关知识就会触类旁通,很容易。

  1.人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。

  2.人工智能是包括十分广泛的科学,它由不同的领域组成,入门较基本的的知识是:机器学习,机械原理,计算机原理,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作,但不同的时代,不同的人对这种“复杂工作”的理解是不同的。

  语音信号预处理。

  语音信号号在采集后首先要进行滤波,A/D变换,预加重(Preemphasis)和端点检测等预处理,然后才能进入识别,合成,增强等实际应用。

  滤波的目的有两个:一是抑制输入信号中频率超出//2的所有分量(/:为采样频率),以防止混叠干扰,二是抑制50Hz的电源工频干扰,因此,滤波器应该是一个带通滤波器。

  A/D变换是将语音模拟信号转换为数字信号,A/D变换中要对信号进行量化,量化后的信号值与原信号值之间的差值为量化误差,又称为量化噪声。

  预加重处理的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,便于频谱分析。

  端点检测是从包含语音的一段信号中确定出语音的起点和终点,有效的端点检测不仅能减少处理时间,而且能排除无声段的噪声干扰,目前主要有两类方法:时域特征方法和频域特征方法,时域特征方法是利用语音音量和过零率进行端点检测,计算量小,但对气音会造成误判,不同的音量计算也会造成检测结果不同,频域特征方法是用声音的频谱的变异和熵的检测进行语音检测,计算量较大。