所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

结合波束形成和BSS改善源分离性能

r·鲁本约翰逊1,美国Aishwarya2
  1. PG学生(信号处理),部门的电气工程、Blekinge理工学院、瑞典1
  2. PG学生(信号处理),部门的电气工程,Blekinge理工学院,瑞典2
相关文章Pubmed,谷歌学者

访问更多的相关文章国际先进研究期刊》的研究在电子、电子、仪表工程

文摘

波束形成(BF)和盲源分离(BSS)总是两个有趣的方法来见证以单独的两个来源。BSS的频域一直面临着一个严重的问题排列歧义在执行源分离使用独立分量分析(ICA)。排列歧义是任何频率之间的不匹配的问题来源,所以在时域分离不能表现出一个完美的分离的频率成分其他来源出现在一个源的时间信号。一直采用各种方法通过多年的研究摆脱这个关键问题,到目前为止没有完美的结果产生。该方法相结合的男朋友BSS似乎是一个好方法是高炉主要取决于到达时差信息(延迟)之间的连续参考麦克风,麦克风。相比原来的延迟信息估计延迟为每个频率线为了调整频率线如果他们看到一个由ICA排列。所以,没有频率不匹配的可能性仍然延迟信息时现有操作作为一个主要的问题。性能测量使用信号干扰比测量,波束形成方法似乎有一个改进的性能比其他现有的方法。仿真结果表明性能比较。测试算法在自由场环境中使用两种语言来源。 We use Short Time Fourier Transform (STFT) for frequency domain transformation

关键字

盲源分离、波束形成、独立成分分析,到达时差,信号干扰比。

介绍

盲源分离(BSS)估计源信号的过程中观察到的信号从任何像麦克风输入通道。在这里,每个信号对应的独立来源的分离。
同样,波束形成是阵列信号处理技术用于本地化资源从不同的方向。它使用数量的线性排列的麦克风。这两个都有自己的独特性和缺点,只要他们是分开在不同的应用程序实现的。应用语音增强、助听器、会议电话,收集,noise-robust演讲认识和免提通信系统要求这些过程来源可解性,没有任何违规行为。BSS结合波束形成时,它可以克服缺点的过程。波束形成方法是健壮的因为一个频率的偏差不影响其他频率在其他方法偏差可能会导致连续失调[1]。波束形成定义的方向到达延迟和求和波束形成算法和BSS使用ICA算法,可以满足在一个公共点为了解决源分离的问题。这个项目涉及两个预计将结合的地步,要考虑这样做的约束组合。

调查相关的工作

存在不同的方法来解决这个问题。基本上排列可以挑出和频带切换完成。的基本思想是将定位排列注意突然变化的一些性质的光谱过滤器或估计组件。摘要[2]宽带波束形成与小波滤波器被用于猎犬full-band语音信号的语音增强系统。在[3]盲波束形成算法被用来恢复期望信号没有阵列几何知识。他们使用多级恒模阵列算法恢复独立信号和估计到达的方向角度。摘要[4],他们使用的方法像信封连续性和过滤器连续性同时使用ICA框架分离声音来源。在[4],null-beamforming基于到来的方向被用来优化和收敛ICA算法。在我们的论文中,我们使用一个简单的波束形成方法,给出了到达时差估计我们作为先验的信息在每个频率线分离混合来源。

问题陈述和主要贡献

在实时的情况下当多个扬声器说话同时观察到一组传感器、录音总是包含混合来源有很少或没有原始的信息来源。这是一个非常经典的和困难的问题来分离成独立的来源。当这个问题在频域内进行调查,主要问题是缩放和排列模棱两可。我们的论文集中于两个主要研究问题:
1。波束形成方法可以用来解决如何排列模棱两可为了提高效率的BSS ?
2。如何检查在inter-frequency依赖方法波束形成方法的性能?我们的方法提出了实现延迟和求和波束形成为了解决排列模棱两可的问题。Beamformer有能力本地化资源使用到达时差(辐射源脉冲)麦克风将非常有用的信息排列模棱两可。辐射源脉冲方法在前面的现有的研究是有点复杂,我们的方法是简单的通过比较与原时差估计时差和交换频率排序。信号干扰比(SIR)的计算和比较来研究波束形成方法的性能在国米的频率依赖性的方法。本文的主要贡献是实施到达时差(辐射源脉冲)基于现有方法解决频率排列的问题。,延迟和求和波束形成了球面波设置和延迟信息作为估计延迟的主要属性。

问题解决方案

出现的问题在会议大厅,免提通信系统、汽车或noise-robust语音识别由于混合来源需要一个有吸引力的解决方案在每个输入通道分离混合来源。基于波束形成的辐射源脉冲方法结合这个独立源信号向量有助于解决源分离的问题。
造型:系统建模是任何实验装置中最重要的部分。我们有一个测试计划与演讲声音来源。所以系统包括麦克风阵列有2球面波源放置在一个合适的高度从数组中平面。在我们定义系统建模之前,有必要描述麦克风阵列实验的必要性。
1。麦克风阵列
麦克风阵列的集合多个麦克风一定安排功能作为单向输入设备。在这里,我们考虑源作为一个球面波前从源对麦克风阵列有不同的影响。那是因为我们针对近场的所有应用程序的应用程序需要接近阵列设置扬声器。它认为波的半径来计算时间延迟和公式如下所示。
图像(1)
在那里,是源和麦克风阵列之间的距离。数组用于我们的设置是一个矩形数组组成的8×8麦克风以非线性的方式。这是安排在x - y平面平行放置这个数组来源。麦克风之间的距离将是0.0425米,决定取决于所使用的源信号的波长。
2。混叠效应
可以定义的阈值频率等距的数组如下,
图像(2)
,是音速和d是麦克风之间的间距。如果声源频率超过这个临界频率,鬼魂出现在指向性图案来源[5]。当声源频率小于临界值,主瓣识别真正的排放源,而典型的侧叶减少。超过临界频率,相反,许多鬼来源出现。因此,标准的解决方案,以避免混叠是麦克风间距的减少错误。
图像(3)
b .波束形成:波束形成是一个过程,执行空间过滤即。,the response of the array of sensors is made sensitive to signals coming from a specific direction while signals from other directions are attenuated [6]. Beamformers combine the signals from spatially separated array sensors in such a way that the array output emphasizes signals from a certain “look” direction. Thus if a signal is present in the look-direction, the power of the array output signal is high and if there is no signal in the look-direction the array output power is low.
1。延迟和求和波束形成
延迟和总和beamformer是基于这个想法,每个传感器的输出信号是相同的,除了每个值从每个传感器将被延迟量不同。球面波前的半径被定义为,
图像(4)
数组中,是麦克风的数量和麦克风之间的距离。
每个传感器的输出适当延迟,然后加在一起,一组传感器由敏感的反应来自一个特定方向的信号,而其他方向的信号衰减。通常,每个通道都同等幅度加权求和,所以方向性模式演示了单位增益在所需的方向。这导致了复杂的通道权重,
图像(5)
表达阵列输出的加权之和渠道获得
图像(6)
在时域等价,我们有,
图像(7)
c .盲源分离:最近,盲源分离的独立分量分析(ICA)已收到关注由于其潜在的应用在信号处理如在语音识别系统中,电信和医学信号处理[7]。ICA的目标是恢复独立的来源只有传感器观测是未知的未被注意的独立源信号的线性混合。
1。独立成分分析。
ICA是一种单独的方法从录音来源。顾名思义,此方法分离混合录音为独立的组件。录音和来源被认为是一组随机变量。因此这里独立必须用其统计意义[8]。两个独立变量和统计独立当且仅当它们的联合概率密度函数(pdf)的产品是他们的边际pdf。
图像(8)
因此ICA旨在得到尽可能接近这个方程。如果超过两个组件,n,前面的方程扩展到第n个维度:是独立的变量
2。频域BSS
开发了不同的方法来解决这个问题。一个是时域方法和频域。[9]。时域方法相当复杂;需要强大的计算资源和计算时间与现有的算法而频域方法是快速和容易理解和实现。BSS方程可以制定时域到频域。众所周知,出现在时域卷积方程将被表示为一个简单的产品在频域
图像(9)
的主要思想为解决convolutive ICA问题可以被看作是简化的步骤如下:
录音转换成使用傅里叶变换频域
对于每一个频率,解决瞬时混合的情况
通过独立的组件发现使用傅里叶反变换回时域
在我们进入处理细节之前,我们必须考虑我们的算法中使用的类型的混合。有一个共同的假设的瞬时混合做记录与实际coeffecients来源的线性组合,说,
图像(10)
是一个随机满秩矩阵,
但是,实时,他们不再是瞬间的,但由过滤版本在每个记录的原始来源。他们被称为convolutive混合。
图像(11)
,是环境的脉冲响应位置接收我的j来源。脉冲响应之间的表达式表示卷积和信号是源[7]。
3所示。由于频域BSS问题
第一个问题是传统的傅里叶变换的问题。如果一个记录信号改变了使用传统的傅里叶变换到频域,它将会变成一个新的信号,每个样本对应一个频率。从此,所有的与时间相关的信息丢失和ICA算法派生之前将无助的,因为它依赖于平均对比功能。因此我们使用-傅里叶变换)。短时傅里叶变换的信号包含频率信息内容和内容的变化随着时间的推移[8]。最微妙的问题,BSS在频域方法的主要问题是排列模棱两可,这引起的歧义是瞬时ICA算法。然而在这个频率域方法中,可以看出,每一个新的瞬时频率ICA问题必须解决。所以有尽可能多的瞬时问题解决许多频率垃圾箱。但由于排列模棱两可,对于不同的频率,组件将在先验评估顺序不同。为了重建并转换回时域随机排列必须针对性和逆转。
4所示。快速ICA
以下描述的算法,将实际上是赫尔辛基大学的FastICA算法开发的技术。很多其他算法存在,然而FastICA算法的简单性和出色的效率是一个不错的选择在这里被研究和使用。该算法可以看作是两个独立的部分。首先,数据预处理,然后这个预处理数据的优化部分。该算法将一步一步在下面[8]。
前处理的数据
执行ICA我们需要预处理数据。预处理主要包括两个步骤。定心和美白数据的数据。定心做是为了确保所有录音零均值,美白是一个简单的线性变换,提供单位方差录音。
b)算法
数据预处理后的定心和美白,算法必须为每个向量w重复下面的过程。
1。开始选择或随机向量的算法
2。从这里开始,必须重复迭代过程只要收敛测试的失败:
计算下一步使用以下方程
图像
应用基本克施密特正交化(迫使un-mixing矩阵的正交性):如果k向量是评估和n + 1步的迭代中,让我们使用的符号向量。然后通过正交化
图像
正常化图像力单位方差的结果
收敛性测试,例如通过评估。如果有任何收敛,存储当前值f指数n重置为零,提高指数k,回到步骤1如果还有组件评估(k < n)。如果没有收敛,继续迭代过程,提高n,回到第2步。
当k = n,被评估的所有组件。给出了独立的组件通过每个)x,为1 < k < n。
d .实现:convolutive盲源分离系统可以被视为自适应波束形成的多个集合,这意味着每个输出的隔离滤波器阵列可以被视为一个beamformer。因此波束形成方法是用来结合频域convolutive BSS处理频率排列问题。
1。到达时差
convolutive盲源分离系统可以被视为自适应波束形成的多个集合,这意味着每个输出的隔离滤波器阵列可以被视为一个beamformer。使用麦克风阵列DOA估计背后的基本原理是利用相位信息出现在信号被麦克风是在空间上分开。因为来源是球形没有必要计算DOA。相反,我们去到达时差(辐射源脉冲)。
如果我们有M个麦克风,我们可以定义−1)目标辐射源的来源,为每一对麦克风。因此,让我们考虑如下,
图像(12)
,r是原始的到达时差和之间的时间延迟(拖)麦克风j, k是参考麦克风。现在,虽然我们有原始时间延迟信息,有必要找出预计到达时差。我们必须找到混合矩阵的值从ICA分离矩阵W获得了估计混合矩阵公式的理解集成电路混合矩阵和Y是独立的信号将类似于原始信号在理想条件。这让基向量elementswhich用于确定预计到达时差。每个基向量矩阵中的元素是用来计算目标辐射源的公式,
图像(13)
,r是信号的时差对麦克风。在这里,两个不同的下标k(原始指数)和我(估计源指数)用于源指数计算原始辐射源和估计辐射源因为排列对齐并不是在这个阶段完成的。
2。结合技术
辐射源脉冲技术是用于该方法来解决排列模棱两可的问题。这是一个简单的健壮的技术使独立源信号的频率垃圾箱Y根据延时信息使用目标辐射源公式[10]。每一对麦克风的原始辐射源的计算是计算使用原来的时间延迟信息,用作参考与每个频率的估计辐射源垃圾箱。每个频率的估计辐射源垃圾箱了价值将远远靠近任何一个原始辐射源脉冲对应的来源。他们比较估计辐射源是否接近值辐射源脉冲源1或2。这是完成了所有频率垃圾箱假设,目前辐射源脉冲值出现在1似乎有值接近原始辐射源o,相应的频率本排列,1组的频率本来源。如果没有这种不匹配看病或2看病,然后他们离开了没有对齐。这是贯穿所有频率箱子检查他们是否在无论如何排列。这里,有趣的是,分离矩阵的相应列W也排列时,每天在家独立源signals1行排列。如果这样做是为了所有的频率垃圾箱,然后他们缩减了时间域以身体听到估计来源。 Now, we could hear a clearly separated speech very much equal to the original speech.
e .验证:该方法测试各种场景的混合语音信号和分析通过比较结果与前面实现的方法(信封连续性)。整个测试运行两个录音和两个来源。
1。方法
系统建模与64麦克风(8×8)和2来源。只有声波测井条件被认为是在这里。从麦克风阵列,我们可以很容易地找到源在空间的位置,计算每个麦克风的到达时差。因为只有2麦克风足以独立的信号,任何两个相邻麦克风从数组中选择和执行源分离。对于我们的情况下,我们已经考虑了两种长度为4秒的语音信号和分离进行了。两个信号的谱图图3所示。图3。
2。信号干扰比
信号干扰比(SIR)是衡量水平的期望信号的干扰信号。它被定义为信号功率之比的干扰信号。
图像(14)
3所示。比较目标辐射源和信封的连续性
各种场景被认为是作为算法的输入,他们讨论如下
不同的麦克风之间的距离
第一个麦克风之间的距离改变,性能记录。爵士的图表显示了变异改进当麦克风之间的距离变化。改善信封连续性爵士在这种情况下是无法遵循轨迹而爵士辐射源脉冲方法的改进是可以预测的。信封连续性方法有很大的效果的初始化向量Fast-ICA算法如前所述。
在辐射源先生改善减少麦克风之间的距离增加,因为延误将会增加当麦克风之间的距离保持增加。当然这可能导致分离性能降低的麦克风可能没有完全接收来源,因此选择正确的源交换回先生是一个问题造成的减少改善。
b)不同来源之间的距离
其次源之间的距离变化,表现记录,微型计算机体积很小。显示,当源之间的距离增加,有一个减少先生改善。信封的连续性和辐射源,最初的图,有爵士的增加改善,然后它开始下降。先生最初的增加改善是由于这一事实的来源是在正确位置系统先生获得最大的进步。然后,爵士的减少改善是由于源信号可能不能正常到达记录系统。延迟较大,将几乎相同的来源有一个混乱的调整每个频率线的延迟它的受人尊敬的来源,从而创建变更来源。但除此之外,初始化向量在ICA算法中起着重要作用对于这个订单少轨迹的方法。它应该有一个很好的收敛速度的500年或1000年根据初始化向量的选择为了有一个渐进的轨迹模式。
c)不同的平面之间的距离
第三个场景是改变麦克风阵列平面和源之间的距离飞机先生检查改进。与前面的情况下,两个信封连续性和辐射源,先生有一个最初的增加改善图7。是由于系统的正确位置先生获得最大的进步。然后它会减少出于同样的原因,我们上面所讨论的,初始化向量的主要作用是这个振动轨迹的方法。
d)不同滤波器的长度
最后一个场景是改变STFT的窗口长度的函数。在图7。信封的连续性和辐射源,我们可以看到改进爵士的下降时窗长度的增加STFT函数。对于一个小窗口长度的增加。(256年至512年),在近间隔频率的行数,从而形成一个平滑的曲线,从而给出了一个更好的性能在先生。但对于进一步增加在1024或2048等窗口长度,它导致减少先生改善是由于数量较少的计算时间信号可用时,分离频率的来源除了有更多的数量在近间隔。不过,当我们比较两种方法,目标辐射源执行比信封连续性是该方法的优势。

结论

在这个项目中,我们回顾了和实现相结合的方法波束形成和BSS convolutive混合到一个更好的分离性能。解决排列歧义是这个项目的主要目的。我们提出了辐射源脉冲技术来解决这个问题。算法测试使用2演讲混合物(男性和女性的声音间隔为4秒音频)。结果评估改进爵士。仿真结果证实了我们的预期,显示辐射源脉冲比信封连续性的方法挺管用的所有条件。当麦克风的位置改变,目标辐射源的性能相比是更好的和高度可预测的信封连续性。信封连续性不遵循可预测减少时尚先生每增加麦克风距离振荡。同样,窗口长度的增加,目标辐射源和信封连续性降低先生在其改进。但是,最高价值的窗口长度,辐射源脉冲的性能很大程度上比信封连续性。 SIR is better even at the worst case scenario also, for TDOA.
我们实现了这一技术在自由场模拟。未来的工作将是实现这个方法的实际环境。自从Fast-ICA随机初始化向量和有大量的参数需要考虑,更健壮的算法Fast-ICA像玉算法可以被替换

确认

我们感谢我们的家人,朋友在印度和瑞典,我们教授Blekinge Tekniska Hogskolan和Bruel·卡亚尔:声音和振动测量/ S,丹麦的宝贵支持和指导这个项目的成功完成。

数据乍一看

图1 图2 图3 图4
图1 图2 图3 图4
图5 图6 图7
图5 图6 图7

引用

  1. 本尼Sallberg。”应用盲语音增强的方法”,博士论文,信号处理,Blekinge理工学院,2008年瑞典。
  2. JiachaoZheng Dongxia Wang,吴道,“宽带波束形成方法基于麦克风阵列语音增强,”2010年第二届国际会议上信号处理系统(ICSPS),锦州,2010,pp.363 - 366
  3. 记周,曹国伟太阳,鑫阳,“通过盲波束形成测向实验研究”IEEE 2010,页281 - 284
  4. Hiroshi Saruwatari, Toshiya河村建夫、Tsuyoki Nishikawa Akinobu Lee KiyohiroShikano,“基于快速收敛算法的盲源分离结合ICA和波束形成,”IEEE反式。在音频、语音和语言处理问题没有。2,pp.666- 678, March 2006.
  5. a . Cigada m . Lurati f . Ripamonti和m . Vanali“波束形成方法:空间混叠抑制使用移动数组”柏林波束形成会议,2008年柏林。
  6. 格兰特芬和安德鲁Paplinski。”模拟传感器的线性阵列的波束形成技术”,机器人技术和数字技术,莫纳什大学,澳大利亚,1995年。
  7. 皮埃尔•通常和基督教Jutten盲源分离的手册:独立分量分析和应用程序,1日版。伯灵顿,MA:爱思唯尔,2010年。
  8. 道格拉斯。H,古普塔M,泽田师傅H和牧野年代,“时空FastICA算法为盲人convolutive混合物的分离,“IEE反式。音频讲话朗。过程。vol.15,不。7月5日,2007年。
  9. 泽田师傅H,向井亚纪R,荒木和牧野年代,“Convolutive盲源分离超过两个来源在频域,”学报》国际会议音响、演讲和信号处理蒙特利尔,2004年,页885 - 888。
  10. Shoji牧野,Te-Won李和Hiroshi泽田师傅,盲语音分离。荷兰:施普林格2007年。
全球技术峰会