当前位置 : 主页 > 编程语言 > python >

【端点检测】基于倒谱距离实现信号端点检测含Matlab源码

来源:互联网 收集:自由互联 发布时间:2022-06-18
1 简介 端点检测算法流程 1)预处理:对16kHz的语音信号x[n]进行预加重以及分帧处理。 2)计算每一帧的倒谱矢量值,并取1到5帧的倒谱参数的平均值作为背景噪声倒谱值。 3)逐帧计算

1 简介


【端点检测】基于倒谱距离实现信号端点检测含Matlab源码_突发噪声

【端点检测】基于倒谱距离实现信号端点检测含Matlab源码_突发噪声_02

 端点检测算法流程

1)预处理:对16kHz的语音信号x[n]进行预加重以及分帧处理。

2)计算每一帧的倒谱矢量值,并取1到5帧的倒谱参数的平均值作为背景噪声倒谱值。

3)逐帧计算倒谱系数和背景噪声的倒谱值,利用上式计算倒谱距离。

4)确定两个门限A1和A2,且A2>A1。

5)根据每一帧的倒谱值进行端点检测,如果这一帧的倒谱距离值大于第一个门限A1,且之后的三个连续的倒谱距离值也都大于A1,则判定这一帧为语音的起点。否则的话,继续检测。对于终点的检测思想也是这样,只是门限值变成了A2。为了避免突发噪声的影响,所以在两个端点的判断上都使用了四个连续的点,只有同时满足连续的四个点的时候,才可以判定当前帧是不是到了规定的门限值。这样做的目的主要是为了防止突发噪声的影响。

2 部分代码

%倒谱法端点检测M1_009.wav,enframe.m放在当前路径
clear all;
[x,fs,bits]=wavread('M1_009.wav');
x=filter([1 -0.95],1,x);%对语音进行预加重,x[n]=y[n]-0.95y[n-1]
L=320; %窗长
FrameLen=320;
FrameInc=160;
%[f]=enframe(x,hamming(320,'periodic'),FrameInc);%加汉明窗
[framenum,f]=enframe(x,FrameLen,FrameInc);
%[framenum,L]=size(f);%显示帧数
P=framenum;%总帧数
%求每帧的倒谱系数,MCep是倒谱矩阵,P行,320列,第一行是第一帧的320个倒谱系数
for ii=1:P
x0(ii,:)=x((ii-1)*L/2+1:(ii-1)*L/2+320);
MCep(ii,:)=ifft(log(abs(fft(x0(ii,:)))));
MCep(ii,:)=fftshift(MCep(ii,:));
end
for ii=3:P-2
MCep(ii,:)=0.3*MCep(ii,:)+0.2*MCep(ii-1,:)+0.2*MCep(ii+1,:)+0.15*MCep(ii-2,:)+0.15*MCep(ii+2,:);
end
MCepn=mean(MCep(1:5,:));% 取1-5帧做背景噪声的倒谱系数帧,MCepn认为是噪声帧的平均倒谱系数,320个样值
%计算倒谱距离dst是1行P列,其第i个值为第i帧与噪声平均帧的倒谱距离(是个具体数值)
for i=1:P
s=0;
for j=2:L
s=s+(MCep(i,j)-MCepn(j)).^2;%计算倒谱距离
end
s=2*s+(MCep(i,1)-MCepn(1))^2;
dst(i)=4.3429*sqrt(s);
end

3 仿真结果

【端点检测】基于倒谱距离实现信号端点检测含Matlab源码_d3_03

【端点检测】基于倒谱距离实现信号端点检测含Matlab源码_突发噪声_04

4 参考文献

[1]王媛, 刘珩. 高噪声环境下基于倒谱距离的语音端点检测算法的实现[J]. 中国农业大学学报, 2006.

博主简介:擅长智能优化算法、神经网络预测、信号处理、元胞自动机、图像处理、路径规划、无人机等多种领域的Matlab仿真,相关matlab代码问题可私信交流。

部分理论引用网络文献,若有侵权联系博主删除。


【端点检测】基于倒谱距离实现信号端点检测含Matlab源码_突发噪声_05


【文章原创作者:防ddos攻击 http://www.558idc.com/shsgf.html 复制请保留原URL】
网友评论