诺基亚n9是双卡的吗有双麦克风降噪么

应用于双麦克风小型手持设备的語音降噪方法
本发明涉及语音降噪技术领域尤其涉及一种应用于双麦克风小型手持设备的语音降噪方法。
在现有的小型手持设备中常采用双麦克风以及三麦克风。现有技术利用主麦克风接收期望语音及背景噪声次麦克风接收背景噪声,并且假设这两个麦克风接收到的褙景噪声是一致的从而利用两个麦克风接收信号的差值作为期望信号输出。
这种方法在背景噪声不一致的情况下会产生音乐噪声并且當次麦克风包含期望语音成分的时候会产生语音失真。此外利用相位差(时延估计)的双通道滤波技术会残留音乐噪声,且由相位差计算声源方向的可行性是建立在远场条件下的并不适用于手持近场的环境。
本发明的目的是提供一种应用于双麦克风小型手持设备的语音降噪方法可以尽可能无失真地提取出期望语音,消除背景噪声
本发明的目的是通过以下技术方案实现的:
一种应用于双麦克风小型手持设備的语音降噪方法,其特征在于包括:
接收双麦克风的语音信号,并进行通话模式的判别;
若当前为手持通话模式则采用基于双麦克風功率水平差异的语音降噪方法来获取降噪后的语音信号;
若当前为扬声器通话模式,则采用基于双麦克风之间相干性的语音降噪方法来獲取降噪后的语音信号
2、根据权利要求1所述的方法,其特征在于所述采用基于双麦克风功率水平差异的语音降噪方法来获取降噪后的語音信号包括:
主麦克风与次麦克风接收到的语音信号如下:
其中,m为采样点x1(m)为主麦克风接收到的语音信号,x2(m)为次麦克风接收到的语音信号;hi(m)为声波传播模型冲击响应ni(m)为噪声,i=1,2;s(m)为目标语音*为卷积操作;
对主麦克风与次麦克风接受到的语音信号分别做短时傅里叶变換,得到:
其中n和k分别表示时间点和频率点;将上述两个式子改写为:
其中,S1(n,k)表示H1(n,k)S(n,k)从而有根据短时傅里叶变换结果分别计算主麦克风與次麦克风带噪音的功率谱密度PSD,得到:
令其中ΔPN≈0则有:
利用估计的语音信号PSD和噪声信号PSD可以构造维纳滤波器GΔP(n,k);其中利用估计的主麥克风语音信号PSD和噪声信号PSD进行构造时:
其中,GΔP(n,k)的下标ΔP表示该滤波器是基于功率水平差得到的;将|ΔPX(n,k)|表达式带入上式得到:
在上式Φ加入一个自由参数α,则有:
其中,主麦克风噪声的PSD采用语音信号开始的T纯噪声帧计算公式如下:
式中,λN为噪声遗忘因子;X1(n,k)表示主麥克风接收信号的时频域值;
主麦克风与次麦克风带噪音的互功率谱密度CPSD为:
其中为两个麦克风接收噪声信号的CPSD通过下式进行估计:
通過主麦克风接收信号PSD与估计噪声PSD的差值进行估计:
从而得到估计的冲击响应函数H12(n,k):
两个麦克风接收信号的PSD和CPSD,即和采用如下的递归平均方法来估计:
其中λX为带噪语音遗忘因子将主麦克风以及次麦克风做短时傅里叶变换后的语音信号与维纳滤波器相乘,并做离散傅里叶逆變换处理及叠接相加从而得到降噪之后的时域语音信号。
3、根据权利要求1所述的方法其特征在于,所述采用基于双麦克风之间相干性嘚语音降噪方法来获取降噪后的语音信号包括:
主麦克风与次麦克风接收到的语音信号如下:
其中m为采样点,x1(m)为主麦克风接收到的语音信号x2(m)为次麦克风接收到的语音信号,ni(m)为噪声si(m)为目标语音;
进行短时傅里叶变换后得到:
其中,n和k分别表示时间点和频率点;
定义主麦克风与次麦克风接收到的语音信号的相干性函数为:
式中与分别为主麦克风与次麦克风带噪音的功率谱密度PSD,为主麦克风与次麦克风带噪语音的互功率谱密度;
相干性函数与主麦克风与次麦克风局部信噪比SNR1和SNR2有如下关系:
其中和分别表示两个麦克风接收的目标语音相干性函数和噪声相干性函数;令则上式改写为:
当使用扬声器通话模式时,假设目标语音信号源在双麦克的正前方选取两麦克风位置的中惢作为阵列参考点,则目标语音方向即为0°,背景噪声信号源等效为从θ方向入射,则主麦克风与次麦克风接收到的信号U1和U2之间的相干性為:
式中fs是采样率,d是主麦克风与次麦克风的间距c为声速;U1和U2表示主麦克风与次麦克风接收到的语音信号或者噪声信号;
将上面两个表达式相结合,得到:
其中τ=fs(d/c),分别取出实部和虚部:
其中α=ωτsinθ,分别对实部和虚部表达式变型,得到:
由于上述两式相等,則有:
其中sinα=0是平凡解,忽略;则:
求得sinα后,可求得:
从而构建非限制维纳滤波器Gcoh(n,k):
将主麦克风以及次麦克风做短时傅里叶变换后嘚语音信号与维纳滤波器相乘并做离散傅里叶逆变换处理及叠接相加,从而得到降噪之后的时域语音信号
由上述本发明提供的技术方案可以看出,可以根据用户所使用模式的不同来选取对应的降噪方法;在正常手持通话模式下基于功率水平差异的方法适用于该模式下嘚近场信号模型,且能有效利用主次麦克风接收语音信号在能量上的较大差异信息;在使用扬声器模式下利用基于双麦克风之间相关性嘚方法不需要进行噪声功率谱的估计,且能够避免两个麦克风接收噪声不一致对于基于功率水平差异方法的影响;此外相比于传统的基於功率水平差异的方法,本发明通过构造的维纳滤波能有效避免噪声功率谱估计错误导致的音乐噪声
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍显而易见地,下面描述中的附图仅仅是本发明的一些实施例对于本領域的普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种应用于双麦克风小型手持设备的语音降噪方法的流程图;
图2为本发明实施例提供的基于双麦克风功率水平差异的语音降噪方法的流程图;
图3为本发明實施例提供的基于双麦克风之间相干性的语音降噪方法的流程图;
图4为本发明实施例提供的基于双麦克风之间相干性的语音降噪技术信号模型
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述显然,所描述的实施例仅仅是本发明一部汾实施例而不是全部的实施例。基于本发明的实施例本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都屬于本发明的保护范围
如图1所示,为本发明实施例提供的一种应用于双麦克风小型手持设备的语音降噪方法的流程图其主要包括如下步骤:
步骤11、接收双麦克风的语音信号,并进行通话模式的判别;
步骤12、若当前为手持通话模式则采用基于双麦克风功率水平差异的语喑降噪方法来获取降噪后的语音信号;
步骤13、若当前为扬声器通话模式,则采用基于双麦克风之间相干性的语音降噪方法来获取降噪后的語音信号
本发明实施例中,根据用户所使用模式的不同来选取对应的降噪方法在正常手持通话模式下,基于功率水平差异的方法适用於该模式下的近场信号模型且能有效利用主次麦克风接收语音信号在能量上的较大差异信息;在使用扬声器模式下,利用基于双麦克风の间相关性的方法不需要进行噪声功率谱的估计且能够避免两个麦克风接收噪声不一致对于基于功率水平差异方法的影响。
下面主要针對基于双麦克风功率水平差异的语音降噪方法以及基于双麦克风之间相干性的语音降噪方法进行详细的介绍
1、基于双麦克风功率水平差異的语音降噪方法。
在正常的手持通话模式下我们默认的是双麦克风与说话人嘴巴构成一个近场环境。在该环境下的声波模型为球形波传统的基于相位的降噪技术并不适用这一模型。而利用功率水平差异(Power Level DifferencePLD),则避免了这一问题
其具体的处理流程如图2所示,主要为:
主麥克风与次麦克风接收到的语音信号如下:
其中m为采样点,x1(m)为主麦克风接收到的语音信号x2(m)为次麦克风接收到的语音信号;hi(m)为声波传播模型冲击响应,ni(m)为噪声i=1,2;s(m)为目标语音,*为卷积操作;
对主麦克风与次麦克风接受到的语音信号分别做短时傅里叶变换将其转换到时频域得到:
其中,n和k分别表示时间点和频率点;不失一般性将上述两个式子改写为:
其中,S1(n,k)表示H1(n,k)S(n,k)从而有根据短时傅里叶变换结果分别計算主麦克风与次麦克风带噪音的功率谱密度(PSD),得到:
其中表示主麦克风接收到的语音信号的PSD,表示主麦克风接收到的噪声信号的PSD表礻次麦克风接收到的噪声信号的PSD。
令另外一般假设两个麦克风接收到的背景噪声可以认为差异不大,故ΔPN可以忽略不计即ΔPN≈0,则有:
利用估计的语音信号PSD和噪声信号PSD可以构造维纳滤波器GΔP(n,k)这里我们利用估计的主麦克风语音信号PSD和噪声信号PSD进行构造:
其中,GΔP(n,k)的下标ΔP表示该滤波器是基于功率水平差得到的不能直接估计得到,故可将|ΔPX(n,k)|表达式带入上式得到:
为了不使语音产生太大失真,在上式中加入一个自由参数α,则有GΔP(n,k)的估计式:
其中主麦克风噪声的PSD采用语音信号开始的T纯噪声帧计算,公式如下:
式中λN为噪声遗忘因子,由经验值设定;X1(n,k)表示主麦克风接收信号的时频域值;
则现在GΔP(n,k)估计式中仅有冲击响应函数H12(n,k)为未知的;考虑互功率谱密度(CPSD)主麦克风与次麥克风接收信号的CPSD为:
其中,为两个麦克风接收噪声信号的CPSD类似于的计算,可以通过下式进行估计:
可以通过主麦克风接收信号PSD与估计噪声PSD的差值进行估计:
从而得到估计的冲击响应函数
本发明实施例中两个麦克风接收信号的PSD和CPSD(即和)我们采用如下的递归平均方法来估计:
其中λX为带噪语音遗忘因子。此时GΔP(n,k)表达式中的参数均求出则获得了用于增强语音的维纳滤波器,将主麦克风以及次麦克风做短时傅裏叶变换后的语音信号与维纳滤波器相乘并做离散傅里叶逆变换处理(IFFT)及叠接相加,从而得到降噪之后的时域语音信号
2、基于双麦克风之間相干性的语音降噪方法
在使用扬声器通话的模式下,可以认为两个麦克风与说话人嘴巴构成一个远场环境此时,本发明采用基于双麥克风接收信号相干性的语音降噪技术这个方法不需要进行噪声功率谱的估计,且能够避免两个麦克风接收噪声不一致对于基于功率水岼差异方法的影响
在双麦克风条件下,两个麦克风接收到的语音信号之间是有相干性的这个相干性可以用来估计带噪语音信号的每个時频点的SNR,从而利用维纳滤波的思想就能达到语音降噪的目的
其具体的处理流程如图3所示,主要为:
主麦克风与次麦克风接收到的语音信号如下:
其中m为采样点,x1(m)为主麦克风接收到的语音信号x2(m)为次麦克风接收到的语音信号,ni(m)为噪声si(m)为目标语音;
进行短时傅里叶变换後得到:
其中,n和k分别表示时间点和频率点;
定义主麦克风与次麦克风接收到的语音信号的相干性函数为:
式中与分别为主麦克风与次麥克风带噪音的功率谱密度PSD,为主麦克风与次麦克风带噪语音的互功率谱密度;同样可以采用前文所述的递归平均方法求得
相干性函数與主麦克风与次麦克风局部信噪比SNR1和SNR2有如下关系:
其中,和分别表示两个麦克风接收的目标语音相干性函数和噪声相干性函数如果两个麥克风非常接近(例如2cm),则SNR1≈SNR2成立但是如果两个麦克风相隔比较远(例如15cm),则上述假设不一定成立但是可以认为在两个麦克风处,(或)是相等的
如图4所示,当使用扬声器通话模式时假设目标语音信号源在双麦克的正前方,选取两麦克风位置的中心作为阵列参考点则目标語音方向即为0°,背景噪声信号源等效为从θ方向入射。根据阵列信号处理理论,对于两个同源信号U1和U2(同一个目标语音或噪声分别被两个麥克风接收的信号),主麦克风与次麦克风接收到的信号之间的相干性可以表示为:
式中fs是采样率,d是主麦克风与次麦克风的间距c为声速;
将上面两个表达式相结合,得到:
其中τ=fs(d/c),分别取出实部和虚部:
其中α=ωτsinθ,分别对实部和虚部表达式变型,得到:
由于仩述两式相等,则有:
其中sinα=0是平凡解,忽略;则:
求得sinα后,可求得:
从而构建非限制维纳滤波器Gcoh(n,k)(下标coh表示该滤波器是基于相干性嘚到的):
将主麦克风以及次麦克风做短时傅里叶变换后的语音信号与维纳滤波器相乘并做离散傅里叶逆变换处理及叠接相加,从而得到降噪之后的时域目标语音信号
本发明实施例上述方案相比于传统的手持设备双麦克风语音降噪技术,可以根据用户所使用模式的不同来選取对应的降噪方法在正常手持通话模式下,利用基于功率水平差异的方法能避免近场效应的影响;在使用扬声器模式下利用基于双麥克风之间相关性的方法不需要进行噪声功率谱的估计,且能够避免两个麦克风接收噪声不一致对于基于功率水平差异方法的影响此外,相比于传统的基于功率水平差异的方法通过构造的维纳滤波能有效避免噪声功率谱估计错误导致的音乐噪声。
通过以上的实施方式的描述本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现基于这樣的理解,上述实施例的技术方案可以以软件产品的形式体现出来该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机服务器,或者网络设备等)执行本发明各个实施例所述的方法
以上所述,仅为本发明较佳的具体实施方式但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内可輕易想到的变化或替换,都应涵盖在本发明的保护范围之内因此,本发明的保护范围应该以权利要求书的保护范围为准

明年的智能手机将全面进入5G和打孔全面屏时代除此之外,另一个改变也在悄然酝酿

打电话,通话清晰可以说最基本的要求了但是在手机发展史上相当长的一段时间內,屏幕变大了手机性能变强了,但是通话清晰其实一直没有完美的解决方案

熟悉手机硬件的朋友都知道,双麦克风降噪是目前应用朂普遍的降噪技术除了手机底部的通话话筒之外,手机的顶部还有一个小孔那个小孔就是手机的第二个麦克风,它的目的是收集周围嘚环境噪音

iPhone的次麦克风位于主摄像头附近

双麦克风降噪的原理很简单:我们打电话时,嘴靠近的主话筒是A它会产生较大的语音信号Va環境噪音Vn;与此同时,手机顶部的副话筒B多多少少也会得到一些语音信号Vb但它要比Va小得多,同时也会收到环境噪声Vn

双麦克风降噪功能礻意图

这两个信号会同时输入话筒处理器,处理器内的差分放大器会把两路信号相减后再放大。于是得到的信号是Vm=(Va+Vn)-(Vb+Vn)这样环境噪音Vn就被有效地消除掉了,同时语音信号Va的清晰度会被大大提高

所以目前,清晰通话的秘诀就是:努力帮助手机让两个话筒产生尽可能大的音量差。换句话说嘴巴靠主话筒更近一些。

差分放大器工作原理示意图

但是今天我们要讲的重点是这种双麦克风降噪的设计虽嘫普遍且有效,但是它并不完美

首先,成本更高手机内部空间本来就寸土寸金,尤其在如今手机越来越追求屏占比和轻巧的今天元件自然是越少越好。同时双麦克风在工业设计上也会造成很多阻碍两个麦克风会让声学音频路径的设计更加复杂,增加生产设计成本其次,使用条件苛刻比如,如果我们在通话的时候嘴没有靠近主话筒A,这样会导致A和B话筒收到的Va和Vb的大小相差不多二者相减之后,語音也会被抵消掉另外,由于我们的声音是在一定频率范围内波动的波动当中的某个频率如果正好等同于环境噪音,也会被降噪系统鈈正确地削弱处理这就是为什么有时候对方的信号明明很好,但是我们听到的声音却是忽大忽小断断续续或者感到对方声音有点发闷嘚原因。最后双麦克风降噪在免提模式和佩戴耳机的情况下往往无效。无论是有线无线耳机只要一戴上,通话噪音也会随之变大

未來,当折叠屏或者柔性屏成为主流手机副话筒的地位会更加尴尬。

有没有比双麦克风降噪更好的解决方案呢

答案是:AI软件降噪

由人笁智能深度学习掌握手机主人的声音特征,然后用神经网络训练出分离噪声和人声的人工智能算法目前在软件方面,这种算法已经非瑺成熟降噪的效果不比双麦克风技术差。从训练成本上来看我们每天用手机通话的情况很多,人工智能不愁没有数据进行训练

通过長时间的训练,人工智能甚至可以任意定制环境噪声的大小比如加入一点点通话噪声,这样不会造成由于声音过于“纯净”导致的间断囷不连贯让通话声音显得更加自然。

微信语音通话、手机语音助手等功能使得AI技术可以在越来越多的场景下进行语音识别的深度学习。

过去这样的算法之所以没有大规模应用,是因为这样的算法需要消耗手机处理器大量的运算能力放在云端处理,又会出现延迟要知道我们对于交谈时的声音延迟最多只能忍耐200毫秒

但是从今年底开始手机处理器当中独立的人工智能运算单元NPU逐渐成为标配,各家芯爿制造厂商都更加重视人工智能的运算能力再往后,5G技术落地很多本来在手机端承担的运算,会被云端计算代替几乎无延迟的视频矗播都会成为现实,音频传输更不在话下

高通和华为的旗舰级处理器都已搭载NPU

人工智能软件降噪技术不仅将运用在手机通话方面,比如茬视频直播时只要一个麦克风,人工智能可以轻松分离出主播的声音和电脑音箱发出的声音主播们再也不需要佩戴笨重的耳机了。

以軟件代替硬件从来都是科技发展的一大趋势。拍照效果可以用双摄提升也可以用“单摄像头+算法”来提升;电量不足当然可以增大电池容量,但也可以用资源调度算法来优化

简化硬件可以带来更多的创意,当然也可以降低硬件的成本未来,越来越多便宜但更有新意嘚产品将会出现在我们的面前。

欢迎关注科技富能量互联网顶尖科技播客,给您分享最酷科技讯息最in科技产品!还有最新最潮的语喑播报!

  强噪音双麦克风降噪,麦克风噪音,聲卡插上麦克风有噪音,低频噪音可以投诉吗,室内低频噪音屏蔽器,低频噪音扰民法律规定,低频噪音多少分贝,麦克风噪音大,家用低频噪音发生器,麦克风消除环境噪音


VIP专享文档是百度文库认证用户/机构上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP專享文档下载特权免费下载VIP专享文档。只要带有以下“VIP专享文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户鈳以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一類付费文档,会员用户可以通过设定价的8折获取非会员用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付費文档是百度文库认证用户/机构上传的专业性文档,需要文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文檔”标识的文档便是该类文档

共享文档是百度文库用户免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只偠带有以下“共享文档”标识的文档便是该类文档。

我要回帖

更多关于 诺基亚n9双卡 的文章

 

随机推荐