所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

旋转相机基于扬声器的声音

是以Garg1,Sandeep女子2纳拉辛格Chauhan311日辛格4艾哈迈德,苏5
  1. 副教授,EI称,Galgotia工程学院大诺伊达,印度北方邦
  2. 学生,EI称,Galgotia工程学院大诺伊达,印度北方邦
相关文章Pubmed,谷歌学者

访问更多的相关文章国际先进研究期刊》的研究在电子、电子、仪表工程

文摘

在本文中,我们引入了一个全新的寓意视频会议已成为越来越普遍的在工作场所。目前,记录一个重要的会议在通常情况下一个人雇来记录会议的整个过程,成本的问题,方便和安全。相机也可以安装在会议室的边缘为了捕获所有的员工和他们的谈话在屏幕上。的过程迫使人们面对的方向记录,使谈话变得尴尬。我们设计了一个系统,要放在桌子的中心,并使用麦克风定位相机,说话的人面对他们这样强调目前说话的人。

关键字

视频会议、麦克风、摄像头、沟通记录。

介绍

在传统的视频会议系统中,雇用一个人来记录整个过程,因此所有的记录都是手工完成的,通过控制摄像机的运动。这种类型的安排在会议室不能有效工作,许多人aretalking在给定的时间。其次,web会议很多相机安装在固定的点从而迫使会议成员笨拙地朝向摄像机在整个会议。此外,那些坐在桌子的另一端是不捕获的屏幕上,因此目前尚不清楚是谁说。我们的目标是提供一个旋转相机或声音会自动跟踪摄像机跟踪演讲者和点本身在这个方向上,允许员工进行正常的会议好像根本就不存在。自成员会议应该关注的人来说,我们的设计将有价值的公司,经常使用web会议。这个概念将完成使用麦克风和确定各自的传入的声音信号之间的延迟

目标和项目的好处

做一个简单的电子设备是能够录制视频会议的会议或会议。它消除了人类工作、成本和安全问题(人工干预引起的常规方法)。根据本发明的一个自动声音跟踪摄像系统和方法的操作提供了显著消除或减少缺点和问题与之前开发的视频会议系统。根据本发明的一个体现,一个自动跟踪摄像系统声音。系统包括一个相机可操作的接收控制信号控制的相机。麦克风阵列包括一个多元化的麦克风。麦克风阵列操作接受一个演讲者的声音,并提供一个表示声音的音频信号。从音频信号议长的位置数据来生成。相机控制器夫妇相机,相机控制器可操作的接收议长的位置数据和确定一个适当的响应相机运动。也必要的控制措施,需要相机,让它自动跟踪议长的位置
记录会议过程没有摄影师和以更低的成本。
提供一个解决方案最佳捕获信息交流(问答、争论或讨论)两人之间的会议。
自动生成的多画面简化了后期制作。

文献综述

过去几年这个概念已经发展多年来首次采用先进的工作是在1995年7月,由JoonyoulMaeng [1]。红外技术是用来跟踪视频会议的议长的位置在1996年,由Brandstein爱德考克,约翰·迈克尔·S [2]。麦克风阵列技术是整个概念引入无线阵列麦克风为了提高良好的接待,并允许扬声器的位置的位置由保罗·c·默兹哈维·f·西尔弗曼[3]。一个算法来决定从线性麦克风说话的位置在1992年[4]数据数组。麦克风阵列在大房间[5]。Computer-steered麦克风阵列的声音转导大房间(j . Acoust卷78 1985),大的声音传感器质量rooms-such礼堂、会议室或教室受损混响和干扰噪声源[6]。这些降解由传感器系统可以最小化歧视的声音从四面八方游客除了所需的源。signal-seeking传感器系统被实现为一个双光束”跟踪扫描”数组。它利用信号属性区分的语言来源和干扰噪声。本研究报告和导出方程都集中在使用4麦克风一个线性阵列定位声源。

电路和主要组件

项目的主要组件
1)单片机。
2)电动机驱动。
3)D。C电动机。
4)麦克风。
5)相机。

答:单片机

这个模块是系统的中央控制单元。它从麦克风阵列收集数据,决定方向演讲者所在,并控制电机控制单元。它会告诉电机控制单元如何直接电机运动。学习算法将在单片机上运行来确定主扬声器。
这里使用的单片机的家庭是PIC 16 f8 -。16号意味着它是家庭的一部分“中档”。这是一个8位单片机的家庭。字母F意味着内存类型是闪存。最后三位数字精确识别图片。
这里我们使用了PIC16F877。这是一个RISC(精简指令集计算机)的设计。记住只有三十7指令。它的代码非常有效运行的所有图片程序内存通常低于规模较大的竞争对手。它是低成本、高时钟速度。
单片机是闪存的记忆
图像
重新烧录的功能,更快的发展。
这种强大的(200纳秒指令执行)然而容易程序装置使它适合更多先进水平A / D应用在汽车工业、家电和消费应用程序。工作频率是0 - 20 mhz。

B。汽车司机

直接与单片机接口直流电机可能影响系统单片机的工作由于emf的直流电机。因此马达驱动器用于接口单片机和直流电机,如IC L293D和L293。
L293D是一个流行的电机驱动器集成电路,可用从6 v至12 v,高达1总输出电流。紧凑型L293D马达驱动器使它更方便使用。

我。数据表的特点

图像
图像
图像
H =逻辑高,L =逻辑低,X =没关系

c .直流电机

所选版本移动摄像机面对扬声器是一个电动机。步进电机被认为但被拒绝的可能性由于步进电机由于惯性缺少一个步骤。这样的缺陷将造成损失精度的系统,需要额外的组件来补救。伺服马达,但是建立在位置反馈这种汽车可以纠正它们可能做出的任何过失。伺服电机也有简单的控制接口和电气连接。这导致更少的部分需要使用步进电机。
电机需要把一个完整的360度和完成一个完整的360度旋转等一些秒2秒(180度/秒的速度)。汽车也需要有足够的扭矩来移动相机所需的速度。125千瓦年代1 t伺服电机满足所有的需求。这种汽车可以移动在无载360度时间间隔为1.56秒92 ounce-inches可以产生转矩。相机加载指定范围内。因此电机可以处理任何相机满足最初的规范和满足自己的规范。汽车也需要控制信号和电源在最终的产品。我们计划生产我们自己的司机,而不是汽车司机使用USB适配器和数模转换器。相机下的电动机只吸引了130 ma加载和运行4.8 v - 6 v直流。一个USB端口可以携带500毫安和900毫安@ 5 v之间。 Thus the motor is compatible with the USB connector device and the USB port of a computer and can function according to the specification.

d .麦克风

有几种不同类型的麦克风:碳、动态、水晶、电容(驻极体)。碳麦克风被第一个发明,主要用于电话应用程序。但他们非常嘈杂的碳颗粒移动麦克风时喋喋不休,这种被取而代之的是更高级的类型。
动态麦克风广泛使用和他们的繁殖是一流的质量。它们用于唱片业在高保真的音乐和语言是必需的。基本上他们是完全相同的作为一个演讲者,唯一的区别是大小。但是他们唯一的限制是非常低的输出。内部结构如图8.2所示。纸气缸,在细铜线伤口,是连接到一个膜动作的力量下声压由声源。这种线圈在一个高的窄隙磁场由永久磁铁。当线圈在磁场移动时,它产生一个电压相同的声音导致运动。
由于低阻(阻抗)的动态麦克风,它通常需要一个变压器,因此它可以连接到一个放大器(称为前置)。这个变压器通常内置麦克风的情况下,如果不在,需要连接麦克风前置放大器输入电阻较低。
图像

e .相机

为我们的相机,我们决定使用一个预先构建的网络摄像头。这些都是设计用于与计算机和经常有广角镜头,使它们适合我们的产品。我们选择了摄像头能够满足我们所有的规格。VGA摄像头或1.3像素。适用于windows操作系统。最后相机的重量是电机能够承受的范围之内。相机位于电机的转子,通过USB电缆连接到计算机。这使得我们的相机输出得到证实

测试过程

1)麦克风阵列:将测试麦克风阵列探测不同位置输入3 - 5米半径内,使用示波器输出将被监控。
2)单片机,单片机单元与麦克风阵列将受到考验。不同的测试用例是不同的人在同时。输出结果可以显示在监视器上显示摄像机的目标方向。
3)发动机控制单元:它将测试使用预定的单片机和会给发动机控制单元的输入。
4)汽车摄像头:电动机的旋转可以利用函数发生器的输入进行测试。我们可以用设备测量转动角。
5)计算机:只有分屏功能应该被测试。我们可以简单地输入两个视频信号是否能正确生成分屏。

公差分析

公差分析主要集中在:
错误的声音来源:
检测由麦克风阵列的几何和噪声的因素。目标是有实际的来源和计算源之间的区别是在20度。这相机仍然能够捕捉演讲者如果不是集中在帧。
相机旋转的误差:
我们将分析错误的原因如果有任何相机旋转。再次我们的目标是限制在20度误差和上面同样的原因。我们将测量的宽容给电机控制与总计所以我们知道相机应该指向后旋转。

减少的概念

我们想出了最初的想法是固定在墙上的摄像系统。我们看到一个缺陷在设计是系统仍然需要在一个演讲者,潜在的远方。这样的距离需要远离内人通信相比,我们的系统。
接下来的想法我们考虑淘汰是固定摄像系统。它需要很多摄像机和麦克风,远远超过由旋转系统。额外的组件添加太多的成本系统。如果系统建于较少,但更广泛的角度相机;然后系统停止关注演讲者;关注的一群人,不太可能有中心发言人的视频。使用无线话筒会创建大型方程显然会增加项目成本和努力独自麦克风会非常昂贵

答:电源图

图像

b .数据流图

图像

C。线路图

图像

D。系统的流程图图

图像

HAZARDAND失效分析

麦克风、电阻器、电容器、A / D转换器、D / A转换器,USB集线器和USB适配器都是标准和他们不异常威胁环境。我们无法找到关于相机的信息,汽车,但这些材料来警告是对环境有害。
唯一的移动我们的系统的一部分是塑料圆顶下的电动机和相机。这意味着几乎没有机会与我们的产品安全问题。我们系统的失败意味着相机不再旋转到正确的位置。这可能的原因是多个的,最可能的是坏连接。因为我们不使用大型电压或电流,这些坏的电线不构成安全隐患。

结论

作为一个概念验证,我们的设计就很好。它可以跟踪一个演讲者在10度的位置在不到3秒,这是相机的范围之内。它还提供一个良好的分辨率显示忽略无关的相机,也不错的噪音,这是至关重要的,以确定谁应该说话。与正确的调整我们的产品或我们的设计将有价值的公司经常做web会议。
仍然有几个问题与我们当前的设计。最大的问题是我们目前使用昂贵的组件阻碍系统的范围。我们要使用廉价组件,使得系统无法检测到低体积演讲者由于其小信号噪声比也我们的系统发送所有的音频和视觉信息的计算机包含许多电线和ananalog数字转换器和昂贵的,这有点不切实际。此外我们还没有设计好办法使我们的设计在视觉上吸引人而屏蔽电机噪音,这是必要的,以便与会者不分心。
理想情况下,我们需要测试麦克风的设计质量,我们使用的,我们也需要将我们的设计结构,使电机噪声和掩盖里面的电子元件和线路。我们设计安静汽车也将从中受益。我们也需要一些方法检测时同时扬声器,相机不之间来回摆动。理想情况下,它会选择其中的一个演讲者跟踪,可能声音议长,但我们还没有找到一种办法做到这一点。最后,所有的电线应该用橡胶覆盖组合在一起,这样他们不纠缠在一起,更直观地突兀。

ACKNOWLEGEMENT

我们借此机会表达我们最深的感激和感谢所有帮助我们的人都直接或间接地向成功完成这篇论文

引用

  1. “自动声音跟踪摄像系统和方法的操作“joonyoulMaeng,埃罗尔·R。威廉姆斯(forgent网络inc .)达成No.08/509,228 1995年7月。
  2. 迈克尔s Bradstein F和哈维·西尔弗曼,一个新的时滞估计寻找源位置使用麦克风阵列,技术报告问题- 116 Mar.1993酒吧没有我/ 1996/027807。
  3. 保罗·c·默兹哈维F silvermen”表征说话使用麦克风阵列辐射模式”问题,工程部门,布朗大学国际扶轮02912。
  4. 张M & M H Er,”另一个算法估计和跟踪说话位置通过麦克风阵列”音频工程学会杂志》上,美国44卷,9号,第736 - 729页,1996年9月。
  5. 张M & M H Er,“跟踪扬声器麦克风阵列的远场方向或大房间”,Proc。IEEE新加坡国际会议网络和信息工程国际会议1995年新加坡pp.541 - 544, 1995年7月。
  6. 特殊问题时滞估计IEEE反式。Acoust、演讲、信号处理、ASSP-29, 1981年6月。
  7. 哈维·f·西尔弗曼&斯图亚特·e·Kirtman两阶段算法确定说话位置从线性麦克风阵列数据,计算机语言(1992)129 - 152。
  8. j·d·约翰斯顿,j·l·弗拉纳根R.Zahn&G.W.Elkoj.acoust.soc。78年是.volume S52-S52 1985。
  9. “电脑操纵麦克风阵列声音转导在大房间”美国声学学会,78号5卷,第1518 - 1508页,1985年11月。
  10. j . m . Delosme m . Morf和b·弗里德兰德。一个线性方程apporoach从time-difference-of-arrival测量定位资源。在院刊ICASSP80 IEEE 1980。