关键字 |
行人检测、目标检测、猪、CoHOG计算机视觉 |
介绍 |
电脑已经成为我们日常生活的必要工具。他们执行任务繁重的计算和数据密集型非常有效,比人类更准确。人们正在试图扩展他们的能力,这样他们执行高级任务,人类如此轻松地执行,我们甚至没有意识到我们正在执行它们。计算机视觉电子旨在复制人类的视觉效果,感知和理解图像。 |
检测人类的图像是一个艰巨的任务由于其变量构成,服装,以及不同背景和环境条件。在智能车辆等许多应用程序是很重要的(IVs),智能交通系统(ITS),司机援助,监测、机器人和智能车辆。据世卫组织[2],已知有120万人死于交通事故。大部分的死亡和伤害涉及骑摩托车的人,骑自行车和行人。8000年欧盟对行人和骑自行车的人被杀,约三lac受伤[3]。印度的道路上在2001年,有80000人死亡,每年在过去十年增长5% [2]。 |
行人事故仍然是第二大来源相关的交通伤害和事故客车后死亡。行人的检测和分类是一个艰难的过程[3]。相机捕捉到的数据将被搜索和功能将显示是否存在行人。许多行人分类方法。行人分类由两个阶段组成:特征提取和特征分类。首先需要我年代有歧视和健壮的特性,以区分人类和非人类即使在困难的照明,不同的姿势,和变形[4] |
行人分类取决于特征提取技术和分类器的性能。如果特征提取技术将无法提取相关特征分类器的性能将会严重的影响。这表明有一个相关性特征提取和分类。最近提出了几种健壮的特征提取方法在文学和尺度不变特征变换(筛选)[5],渐变的柱状图(猪)[4],同现的梯度直方图(CoHOG) [6]。也存在一些分类器像隐马尔科夫模型(HMM),支持向量机(SVM)和神经网络。记住没有最好的分类器效果最好在所有给定的问题。 |
人检测是一项非常具有挑战性的任务,许多应用程序,近年来吸引了大量的关注。 |
挑战 |
构建一个健壮的对象探测器最重要的困难是图像和视频的变异量。有几个因素:[7] |
Firstly, 图像 形成 过程 抑制 3-D 深度 信息 并 创建 依赖 关系 的 观点 , 即使 是 很小 的 变化 object’s 位置 或 方向 对 相机 可能 会 改变 其 外观 considerably. 中心一个相关问题是大尺度的变化,一个对象可以查看。一个对象探测器必须处理的问题的观点和规模变化和为他们提供不变性。 |
Secondly, 最 自然 的 对象 类 有 大量 在 课堂 variations.例如,对于人类的外表和姿势变化之间的大幅图片和不同的服装创造进一步的改变。一个健壮的探测器必须设法实现这些变化的独立性。 |
Thirdly, 背景 杂 波 是 image. 共同 和 不同 的 图像户外场景示例图像在自然环境中,在城市和室内环境。探测器必须能够区分对象类和复杂背景区域。 |
The 前 两 simultaneously. 必须 解决 的 困难 存在 冲突 的 挑战探测器非常特定于特定对象实例少会给虚假检测背景区域,但也将错过许多其他对象实例,而过于通用检测器可以处理大型内部类变化但将产生很多错误检测背景区域。 |
Fourthly, 物体 色 和 通用 照明 变化 considerably, 例如 白天 阳光 直射 和 阴影 在 如影随形 伴 人工 或 昏暗 的 灯光虽然颜色和光照不变性模型取得了很大的进步,他们仍远非有效的解决方案相比,人类和哺乳动物的视觉系统,非常适应这样的变化。因此一个健壮的对象探测器必须处理颜色变化和提供广泛的照明不变性和照明的变化。 |
Finally, 部分 遮挡 创建 更多 困难 , 因为 只有 processing. 对象 是 可见 的 一部分 |
图1.1显示了一些例子说明这些挑战人检测。图1.2提供了一些实例在人类使用推理和背景信息删除错误的检测和选择正确的。图1.3显示了几双连续图像INRIA的数据库。与图1.1中有更多的变化。 |
另一个挑战是高层上下文和背景信息的数量,人类可以处理,但电脑仍然缺乏。 |
|
面向梯度的柱状图 |
面向梯度直方图(猪)特征描述符用于计算机视觉和图像处理的对象检测的目的。技术方面出现本地化的部分图像的梯度方向。这种方法类似于边缘方向直方图,尺度不变特征变换描述符,和形状上下文,但不同,它是计算密集的网格均匀间隔的细胞,并使用重叠的局部对比度归一化提高准确性。 |
已经中间人和比尔组织[4],法国国家研究所的研究人员在计算机科学和控制(法国),第一次描述面向梯度直方图描述符CVPR在2005年6月发表的研究论文。在这工作他们集中算法在静态图像中的行人检测问题,尽管此后他们扩大他们的测试包括人类探测在电影和视频,以及各种常见的动物和车辆静态图像[20]。 |
猪背后的基本思想是,本地对象的外观和形状特征可以通过强度的分布梯度或边缘的方向。实现很简单,图像分为小细胞,每个细胞边缘梯度方向的一维直方图或方向收集细胞内的像素。收集这些直方图代表了描述符。获得更好的性能可以contrast-normalized当地响应计算能量的测量在更大空间区域称为“块”,使用规范化的结果中的所有细胞块。这个归一化块被称为面向梯度(猪)的柱状图描述符。该标准化有助于更好的光照不变性,阴影等。图3.3显示了猪方法的概述。 |
|
神经网络分类器 |
最后的对象识别的最后一步使用喂猪描述符描述符到一些分类器。神经网络由单元(神经元)组成,排列成层,一个输入向量转换成一些输出。每个单元需要一个输入,一个(通常是非线性)函数适用于它,然后将输出传递到下一层。一旦训练图像包含某些特定对象,神经网络分类器可以决定对一个对象的存在,等一个人,在额外的测试图像。在中间人和组织人类识别的测试中,他们使用的免费SVMLight软件包[7]结合他们的猪描述符找到人物在测试图像。这里我们使用神经网络。我们使用100个神经元的神经网络。神经网络训练,直到性能误差小于0.01图3.5解释所涉及的方法计算猪描述符。猪有两个优点:一是对光照鲁棒性方差因为当地区域的梯度方向不改变照明方差。第二个优势是其对变形的鲁棒性。 [6] |
|
同现面向梯度(COHOG)的柱状图 |
同现的柱状图的梯度(CoHOG)由渡边[6],是一个基于多个梯度方向特征描述符。CoHOG积木是双梯度方向。因为单一梯度方向只有8个品种,但一双有更多的品种。因此CoHOG可以表达形状比猪更详细,它使用单一梯度方向如图3.6所示。图3.6(一个)显示一个梯度方向只有八个变化和3.6 (b)表明,对方向有更多比一个品种。 |
|
图3.7显示了渡边的CoHOG过程的概述。第一部分计算梯度方向的双从输入图像。然后在第二部分同现矩阵计算。CoHOG构建双梯度方向直方图。这个柱状图被称为同现矩阵。同现矩阵梯度方向的分布在一个给定的偏移量。的同现矩阵nxm图像由一个偏移量(x, y) |
|
我代表一个梯度方向的图像和p和q表示梯度方向。最后一部分分类结果,并确定是否输入映像都包含一个对象。基于CoHOG是梯度直方图,它有相同的优点的猪,这是鲁棒性对变形和照明方差。这是因为基于CoHOG是梯度直方图特征描述符。CoHOG计算的过程如图3.7所示(一个) |
|
最后,同现矩阵的结果是连接到一个向量,如图3.7 (c)。CoHOG计算算法如图3.8所示 |
|
实验结果讨论 |
作为Co-HOG详细表达形状因此高维。渡边等显示在他们的论文中[6],Co-HOG比猪更有意义,因为CoHOG比猪更有效的值。CoHOG递增计算共生矩阵的组成部分,而猪计算是一个复杂的过程,因为它涉及到更多像加权投票程序,直方图归一化、区域重叠。CoHOG达到高性能没有这些复杂的程序。 |
特征尺寸是25倍小于特征尺寸(34704)[6]。图4.1 (a)、(b)、(c), (d), (e)分别显示,原始图像的缩放图像,灰色图像梯度图像和图像后分配箱的梯度方向。 |
总特征尺寸= No。块(21)X同现矩阵(16)的大小。的社区(4)= 1344 |
|
培训 |
我们测试了CoHOG挑战性的数据集,“法国”,[21]广泛用作人类检测基准数据集。这个数据集包含人类图像和非人类图像组成的3030正面形象的不同大小和4000个随机图像大小为128 x 64负面形象。我们使用100个神经元的神经网络。神经网络训练,直到性能误差小于0.01。培训的混淆矩阵图4.2所示。图4.4 (a)、(b)、(c), (d)分别显示了正确的操作特征(中华民国)的培训、验证、测试和ROC曲线。 |
如图4.4 (a),培训民国,我们得到了99.9的准确性。神经网络与一组基准测试数据集和分类的结果提供了下表3。表中提供的措施的意义解释在表二世。对于数据集。1、2、3和4的分类精度是99.4,97.7,97.7 - 58.5。没有对数据集。4,分类精度是58.5;不太可能是因为集包含不同大小的图像和它包含的人群。 |
|
|
|
|
|
我们测试了猪在同一数据集INRIA[9],我们使用分类器作为神经网络而不是支持向量机使用的原作者已经中间人。混淆矩阵的训练是如图4.6所示 |
同一组的神经网络测试基准数据集和分类的结果提供了下表3。表III提供的措施的意义解释为每个表II。对于数据集。1、2、3、4的分类精度是98.9,77.2,97.7和44.6。没有对数据集。4,分类精度是44.6;不太可能是因为集包含不同大小的图像和它包含的人群。 |
|
|
猪和CoHOG结果的比较 |
表4显示了猪和CoHOG特征提取方法的比较。从比较方法,CoHOG优于猪这是因为CoHOG使用双梯度方向从而更详细地表达形状。猪各种描述符参数的影响,得出结论,小尺度的梯度,细定位面元,相对粗空间装箱,与高质量的局部对比度归一化重叠描述符中块都是重要的良好的性能。通过比较与CoHOG猪,CoHOG少错过率(即。,the rate of human images classified as non-human) than half that of HOG. Also we use neural network for training and it gives good result in both. |
结论 |
在本文中,我们研究了两个著名的特征提取方法,猪,CoHOG使用神经网络。从实验结果我们可以说CoHOG是健壮的方法相比,猪。如果提取方法是健壮的进一步处理的步骤就会容易。CoHOG是健壮的方法对光照变化,变形,服装、闭塞。详细CoHOG表达局部和全局形状。实验结果表明CoHOG更好的性能比艺术状态的方法(文献综述中提供)或至少可比INRIA的数据集和一贯良好。我们也使用神经网络作为分类器,而不是支持向量机。它提供了更好的结果。此外,CoHOG可以比猪快40%计算。 |
引用 |
- 米兰Sonka诉Hlavac r·博伊尔,“图像处理、分析与机器视觉”第三版Cengage学习
- t·甘地和M。M Trivedi,“行人保护系统:问题,调查,和挑战,“IEEE反式。智能系统。8卷,没有。3,Sep. 2007
- Pangop穿等,“基于功能的行人Classificatio MultisensorFusio使用贝叶斯公式在室外环境中,“Inproc。IEEE智能车辆研讨会Instanbul,土耳其,2007年6月
- NavneetDalla和比尔区格”的梯度直方图的人体检测,”在proc。IEEE计算机学会计算机视觉与模式识别会议(CVPR ' 05) 2005
- d·g·劳”独特的形象特征尺度不变的要点,“IJCV, 60(2): 91 - 110年,2004年。
- t .渡边Satoshi Ito、横井太郎”同现的梯度直方图的人体检测,“IPSJ交易计算机视觉和应用程序卷。2 39-47 2010年3月
- NavneetDalal“发现人们在图像和视频”的论文报告
- r·拉杰什k . Rajeev诉Gopakumar k . Suchithra副总裁Lekhesh,“尝试行人使用神经网络分类,“IEEE 2011
- c·哈里斯和m·斯蒂芬斯。联合的角落和边缘检测器。阿尔维视觉会议上,147 - 151页,1988年。
- [10]k Mikolajczyk和c·施密德。一个仿射不变的兴趣点探测器。第七届欧洲研讨会论文集ComputerVision,哥本哈根,丹麦,卷我,128 - 142页,2002年5月。
- t . Lindeberg。特征检测与自动选择。国际期刊的计算机视觉,30(2):79 - 116年,1998年。
- k . Mikolajczyk和c·施密德。规模和仿射不变的兴趣点探测器。国际计算机视觉杂志,60(1):63 - 86年,2004年
|