1 内容介绍
说话人识别是当前语音识别的研究热点之一。本文主要研究了以下几个方面:说话人语音识别系统,对能够反映人对语音感知特性的Mel频率倒谱系数(MFCC)作为特征参数进行提取。同时,分析了最近邻KNN。实验结果表明,KNN对训练的语音样本有着很高的分类准确率。
2 部分代码
function fileList = getAllFiles(foldername)%
folderData = dir(foldername);
folderIndex = [folderData.isdir];
fileList = {folderData(~folderIndex).name}';
if ~isempty(fileList)
fileList = cellfun(@(x) fullfile(foldername,x),...
fileList,'UniformOutput',false);
end
subfolders = {folderData(folderIndex).name};
errIndex = ~ismember(subfolders,{'.','..'});
for iDir = find(errIndex)
nextDir = fullfile(foldername,subfolders{iDir});
fileList = [fileList; getAllFiles(nextDir)];
end
3 运行结果
4 参考文献
[1]曹辉, 徐晨, 赵晓,等. 说话人识别中的Mel特征频率倒谱系数[J]. 西北大学学报(自然科学版), 2013, 43(002):203-208.
[2]于树本. 基于MFCC的说话人语音识别系统的研究[J]. 黑龙江科技信息, 2015.