语音MFCC特征参数提取（声纹识别）免费源代码下载-CodeForge.cn

源代码 / 语音MFCC特征参数提取（声纹识别）

语音MFCC特征参数提取（声纹识别）

2016-08-23

4.2 分

其他

如何获取积分？

在语音信号处理中，基本上都采用短时声学参数。所谓短时声学参数，就是把语音按照 20～40 毫秒一帧分段处理后，通过傅立叶变换等手段，然后经过离散余弦变换降维之后的一种特征。这种特征一般输入是几百个语音采样点(20ms*8K=160)，输出是 39～57 维的固定维数的特征参数，便于用于模式识别。MFCC 是一种听觉感知频域倒谱参数，该参数从人耳对声音频率高低的非线性心理感觉角度反映了语音短时幅度谱的特征，因此无论在语音识别还是说话人识别中都得到了极为广泛的应用。
本程序用于提取语音文件的MFCC特征参数，输入语音的sph格式文件，输出后缀名为mfc的特征参数文件。taaa.sph 为原始语音文件，taaa.mfc为输出的MFCC特征参数文件。本程序除了提取特征参数外，还包括活动端点检测（ Voice Activity Detection, VAD）、倒谱平均消去（ Cepstral Mean Subtraction, CMS）、 RASTA
（ RelAtive SpecTrAl）滤波、高阶差分参数等处理过程。