所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

基于神经网络的睡意预警系统的研制

Itenderpal辛格1,彭安杰教授2
  1. M.Tech。印度旁遮普省阿姆利则市阿姆利则工程技术学院欧洲经委会系学者
  2. H.O.D,印度旁遮普阿姆利则工程技术学院ECE/EEE系
有关文章载于Pubmed谷歌学者

更多相关文章请访问国际电气、电子和仪器工程高级研究杂志

摘要

本文提出了一种基于图像处理技术和神经网络的车辆驾驶员睡意预警系统。该系统基于面部图像分析,可以警告司机睡意或注意力不集中,以防止交通事故的发生。驾驶员的面部图像由安装在驾驶员前方仪表板上的摄像机拍摄。提出了一种基于神经网络的算法,通过测量眼睛的开合来确定疲劳程度,并相应地警告驾驶员。结果表明,该专家系统能够有效地提高行车安全性。

关键字

困倦预警系统;事故;人脸检测;眼睛检测;神经网络

介绍

由于近年来汽车数量的增加,事故造成的问题也变得更加复杂。传统的交通运输系统已经不够用了。近年来,智能车辆系统逐渐兴起,成为交通研究领域的热门课题。然而,车辆安全性研究是智能汽车系统研究的一个重要子集。同时,主动预警系统是主动安全系统的设计之一。安全预警系统,主要是预防交通事故的主动预警系统已经引起了公众的广泛关注。安全驾驶是全世界社会关注的一个主要问题。每年有成千上万的人因司机在开车时睡着而死亡或受重伤。最近的研究表明,在高速公路和单调的道路上发生的严重或致命事故中,司机的困倦占20%,这损害了司机的判断力和控制车辆的能力。因此,开发与瞌睡相关的交通事故预防实时安全系统至关重要。许多方法已经被开发出来,其中一些目前正在用于检测驾驶员的睡意,包括测量生理特征,如脑电图、心率和脉搏率、眼睑运动、凝视、头部运动和车辆行为,如车道偏离和转向运动。 Among those different technologies, ocular measures, such as eye-blinking and eyelid closure, are considered as promising ways for monitoring alertness.
本文的目的是开发一个原型的睡意检测系统。重点将放在设计一个系统,将准确监测司机眼睛的打开或关闭状态的实时。通过监测眼睛,可以尽早发现驾驶员疲劳的症状,从而避免发生车祸。

相关工作

为了对驾驶员的睡意进行分析,建立了多个系统。他们通常需要简化问题以部分工作或在特殊环境下工作,例如D. Taneral等人[6]提出了一种基于监测眨眼持续时间变化的自动嗜睡司机监测和事故预防系统。他提出了一种方法,利用眼睛的水平对称特征来检测眼睛位置的视觉变化。这种新方法通过标准网络摄像头以110帧/秒的分辨率(320×240)实时检测眨眼。Flores Javier macro等[11]提出了一种基于视觉信息和人工智能的自动驾驶员睡意检测的新型高级驾驶辅助系统(ADAS)。这个系统经过几个阶段才能完全自动化。此外,该算法的目标是定位和跟踪面部和眼睛,以计算睡意指数。Garcia .i等[3]提出了一种基于计算机视觉的非侵入性睡意检测方法。它安装在汽车上,能够在实际操作条件下工作。一个红外摄像机被放置在司机前面的仪表板上,以检测他的面部,并从他们的眼睛闭上获得睡意线索。 It works in a robust and automatic way, without prior calibration. The presented system is composed of 3 stages. The first one is pre-processing, which includes face and eye detection and normalization. The second stage performs pupil position detection and characterization, combining it with an adaptive lighting filtering to make the system capable of dealing with outdoor illumination conditions. The final stage computes PERCLOS from eyes closure information. In order to evaluate this system, an outdoor database was generated, consisting of several experiments carried out during more than 25 driving hours. Sharma nidhi et al. [5] presented a novel approach to alert a driver who tends to doze off while driving to avoid road crashes. In her system using a small camera that points directly towards the driver’s face, an image is obtained. From that image, skin region i.e. face is segmented out using YCbCr colour space. Finally localization of eyes is done with fuzzy logic application to determine the level of fatigueness and then warn the driver accordingly.

我们提出的算法

图像
第一步是图像采集,这是通过使用摄像机来完成的,它将驾驶员的视频转换为图像帧。
图像
第二步是人脸检测,其中我们使用viola -Jones算法来检测人脸,viola -Jones算法是基于对输入图像进行探索,通过子窗口的方式来检测特征。此窗口可缩放以检测图像中不同大小的人脸。维奥拉·琼斯开发了一种尺度不变检测器,它可以多次遍历图像,每次都有不同的大小。由于尺度不变,无论图像大小,探测器都需要相同的计算次数。
图像
图像
图像图像图像
第三步是眼睛检测。同样,使用该算法检测眼睛。为了检测眼睛,我们首先检测鼻子,然后检测眼睛。然而,RGB模型除了颜色之外还包括亮度。对于人眼来说,同样的颜色,不同的亮度意味着不同的颜色。在分析人眼时,RGB模型对图像亮度非常敏感。下一步是提取眼睛的特征,即将RGB图像转换为YCBCR图像:Cb和Cr分量很好地指示了像素是否属于皮肤的一部分。这可以在图8中清楚地看到,其中是作为眼睛一部分的所有像素的Cb和Cr值。皮肤像素的Cb和Cr值之间有很强的相关性,可以揭示眼睛和非眼睛在YCbCr空间中的比较。
图像
图8。显示YCbCr中的图像。由于肤色颜色取决于亮度,我们对YCbCr颜色空间进行非线性变换,使皮肤清晰。将图像转换为YCbCr域的主要优点是可以在图像处理过程中去除光度的影响。在RGB域中,图片的每个组成部分(红、绿、蓝)都有不同的亮度。然而,在YCbCr域中,所有关于亮度的信息都是由Y分量给出的,因为Cb(蓝色)和Cr(红色)分量与光度无关。下一步是计算眼睛的均值和标准差,即睁开、昏昏欲睡和闭上的图像
图像
图像
图像
最后一步是使用反向传播算法对网络进行训练。我们提出的神经网络模型如图12.512所示,输入节点代表眼睛的特征,输出节点的标签代表类别。
图像
图像
如图13所示,即输入列表<512*60 double>是我们用来训练神经网络的图像的特征。这些特征是睁开、昏昏欲睡和闭上眼睛。512是我们图像的大小,60是输入图像,即20张睁开的眼睛,20张昏昏欲睡的眼睛,20张闭着的眼睛。
图像
图像图像图像
上面的图14、15和16是我们提出的神经网络的三个目标模式。在我们的工作中,目标矢量编码使用一种热编码方法。One-hot指的是一组位,其中合法的值组合只有一个高(1)位,其他都是低(0)位。例如,解码器的输出通常是One-hot码。表a以一种热编码形式显示心律失常类别及其对应的目标向量。
最后一步是警报信号的图像识别:经过训练的神经网络很容易预测眼睛是睁开、闭上还是昏昏欲睡。在这种情况下,如果输入的图像作为闭眼的驱动程序。我们的神经网络识别如下图所示的图像,并自动生成警报信号,提醒司机。
图像

结果和讨论

事件检测的准确性是决定睡意检测系统准确性的最重要因素。本文采用反向传播算法训练MLP前馈神经网络模型,以区分三种类型的眼部心律失常。采用不同的性能指标对所设计的分级机进行了评价。这里使用的性能指标是
1.混淆矩阵(分类矩阵)。
2.均方误差。
3.错误直方图。

A.混淆矩阵

利用混淆矩阵(又称混淆表)对分类器的性能进行分析。它显示了与测试数据中的实际分类相比,模型做出的正确和不正确预测的数量。混淆矩阵列出了每个类的正确分类和预测分类。每个类别的正确预测数量沿矩阵的对角线下降。所有其他数字都是特定类型的错误分类错误的错误数。在表B中,我们可以看到,当我们考虑整体数据集时,准确率达到了96.7%,这是一个非常好的数字。与其他阶段相比,误分类率较低。在这里,我们可以看到,class1被错误分类为2类和3类的次数为0次,2类被错误分类为1类和3类的次数为0次,错误分类为1类和2类的次数为0.0%,3类被错误分类为1类和2类的次数为1.7%,并被正确分类为3类。在表中,我们可以看到绿色方框代表每个类的最终精度,因为每个类都是正确训练的。
图像
最后总体准确率如蓝框所示,表明心律失常分类器正确学习了各类分类,均方误差为零,且在LM算法规定的参数范围内,分类结果为96.7%。

b .均方误差

训练神经网络的过程包括调整网络的权重和偏差的值,以优化网络性能,由网络性能函数net.performFcn定义。均方误差是输出和目标之间的平均平方差。MSE值越低,表示网络性能越好,0表示没有错误。
图像
其中,t -目标,a -实际输出,e -误差,n -样本数量
性能曲线图如图17所示。
图像
结果表明,神经网络分类器在了解数据集的性质以及了解P峰、R峰、RR区间等不同特征之间的因果关系方面非常有效。

C.误差直方图

直方图用于绘制数据的密度,通常用于密度估计:估计基础变量的概率密度函数。用于概率密度的直方图的总面积总是归一化为1。如果x轴上的间隔长度都是1,则直方图与相对频率图相同。没有“最佳”的容器数量,不同的容器大小可以揭示数据的不同特征。
图像

结论及未来范围

开发了一种无创的眼睛定位和疲劳监测系统。通过各种自主研发的图像处理算法获得闭眼程度信息。在监测过程中,系统能够判断眼睛是睁开、昏昏欲睡还是闭上。当眼睛昏昏欲睡或闭上时,就会发出警告信号。神经网络提供了一种完全不同的、非正统的方法来处理控制问题,这种技术应用起来并不难,结果通常是令人惊讶和满意的。
对于未来的范围,我们建议可以研究更多的特征,包括当人喝醉时虹膜的大小和形状的变化,或者当眼睛有光泽的外观时,或者必须研究水平凝视眼球震颤的概念,以便使用其他机器算法(如SVM)获得更好的准确性。

参考文献





















全球科技峰会