语音MFCC特征参数提取(声纹识别)
2016-08-23
31 0 0
4.2 分
其他
如何获取积分?
在语音信号处理中,基本上都采用短时声学参数。所谓短时声学参数,就是把语音按照 20~40 毫秒一帧分段处理后,通过傅立叶变换等手段,然后经过离散余弦变换降维之后的一种特征。这种特征一般输入是几百个语音采样点(20ms*8K=160),输出是 39~57 维的固定维数的特征参数,便于用于模式识别。MFCC 是一种听觉感知频域倒谱参数, 该参数从人耳对声音频率高低的非线性心理感觉角度反映了语音短时幅度谱的特征,因此无论在语音识别还是说话人识别中都得到了极为广泛的应用。
本程序用于提取语音文件的MFCC特征参数,输入语音的sph格式文件,输出后缀名为mfc的特征参数文件。taaa.sph 为原始语音文件,taaa.mfc为输出的MFCC特征参数文件。本程序除了提取特征参数外,还包括活动端点检测( Voice Activity Detection, VAD)、 倒谱平均消去( Cepstral Mean Subtraction, CMS)、 RASTA
( RelAtive SpecTrAl)滤波、 高阶差分参数等处理过程。
本程序用于提取语音文件的MFCC特征参数,输入语音的sph格式文件,输出后缀名为mfc的特征参数文件。taaa.sph 为原始语音文件,taaa.mfc为输出的MFCC特征参数文件。本程序除了提取特征参数外,还包括活动端点检测( Voice Activity Detection, VAD)、 倒谱平均消去( Cepstral Mean Subtraction, CMS)、 RASTA
( RelAtive SpecTrAl)滤波、 高阶差分参数等处理过程。
c++
语音
识别
mfcc
提取
参数
特征
相关源码推荐
中文语音识别
0
0
暂无评分
选择相关度较高特征
0
0
暂无评分
局部路径规划算法-DWA算法
0
0
暂无评分
enDAQ-Shock-Data-Share-SRS-Blog
0
0
暂无评分
在Windows应用程序里调用chatGPT
0
0
暂无评分
暂无评论