关键字 |
光学字符识别、神经网络、分类、反向传播。 |
我的介绍。 |
手写字符识别是图像处理和模式识别领域。有两种方法对模式识别等统计和结构[1]。在统计方法中,特征测量的ser生成输入数据统计的基础上,分配给一个n类。对象的结构描述是基于输入数据的相互联系和相互关系的特征。总的来说,这两种方法广泛应用于模式识别。 |
笔迹以来不同的作家不同,构建一个通用识别系统,识别所有字符具有良好的可靠性是不可能在每一个应用程序。因此开发识别系统实现可靠性能的具体应用。特别是,手写数字识别应用于识别数量写在检查银行和邮政编码为邮政信封。手写数字识别系统可分为四个阶段,如图1所示。 |
Data 收购 |
Pre-processing |
Feature 提取 |
Classification |
论文的概述如下。在第二部分中,一个角色造型和预处理步骤进行了讨论。在第三部分中,特征提取技术。在第四部分,简要回顾神经网络和反向传播算法训练神经网络进行了讨论。在第五部分,实验分析。最后在第六部分,结论和未来的范围描述。 |
二世。预处理步骤 |
在离线字符识别系统中,图像被公认是被光学扫描仪。输入数据分析的效率可以提高前处理的扫描图像字符[2]。预处理阶段旨在提取相关的文本部分字符图像通过执行各种操作,如二值化、降噪、变薄、骨架化、规范化和压缩。 |
图像失真是由于引入的噪声图像采集光学扫描和二值化等。是不可能消除这种失真,但可以减少各种降噪技术。这些技术可以分为三大组,如过滤使用卷积操作,形态学操作使用逻辑操作和噪声模型[3]。当捕获图像,灰度的格式即形式的像素密度值在0到255之间。在二值化,灰度图像阈值和转换成关键图像形式的0和1。有两种方法来binarize等图像全局阈值和局部阈值。在全球的阈值只有一个阈值为整个文档选择[4]。局部阈值为每个像素使用不同的阈值在当地的帮助信息[5]。 |
骨架化的过程是消除或删除额外的像素的字符不属于的支柱的角色形象。正常化的过程是随机大小的图像转换成标准大小的图像。这里我们有归一化图像32 * 32的大小,以避免国际米兰类不同的角色中。 |
三世。特征提取 |
因为许多分类器不能处理原始图像或数据有效,提取数据的相关信息是必要的。特征提取是旨在提取相关信息的步骤b降低数据的维数。分类器的性能取决于从数据中提取的质量特性。在字符识别系统中,常用的统计特性,结构,时刻和全球的转换。 |
为了获取执行分类的特点和步骤,需要数字缩小后的框架。这个框架包括输入数字的重要数据和图像的不必要的数据。寻找缩小框架的数字,前景的像素的坐标最远的左,右,向上和向下的一面。在这种传统的特征提取方法[6],如果一条线穿过一个像素(前景),那么相应的像素将给定的值(1)之一。如果行不通过一个像素(背景),然后它被认为是零(0)。 |
四、分类 |
神经网络这一术语通常用来指生物神经元的网络或电路。现代使用的术语通常指人工神经网络(ANN)或模拟神经网络(SNN)。人工神经网络是一组相互关联的自然或人工神经元信息处理,使用数学或计算模型。在大多数情况下一个人工神经网络是一种自适应系统,改变其结构基于外部或内部流经网络的信息。在更实际的方面,神经网络非线性,统计数据建模和决策工具。它们可用于模型复杂的输入和输出之间的关系或数据中寻找模式。 |
我们实现了一个多层前馈神经网络与隐层,如图3所示。神经网络的拓扑结构包括1024个输入节点,50个隐藏节点,和10个输出节点。我们实现了反向传播算法训练网络。 |
五、实验分析 |
在预处理过程中,每个字符归一化到32 x 32像素图像,随着噪声/除热刺。对于这些规范化的图片,我们已经被传统技术提取的特征值。因此32 x 32形象,对神经网络输入节点1024和学习使用反向传播算法实现。培训目的我们使用25每个类的样本和测试应用于所有50图像。数字0是指定为1级,数字1类2,所以数字9类10。 |
六。结论和未来的范围 |
在这个工作我们实现了一个神经网络的离线识别手写的孤立的数字。场大病和规范化二进制像素的位数被用作多层感知器网络的输入。实验结果表明,传统的特性与反向传播网络收益良好的分类精度为100%,识别精度为91.2%。工作结果可以扩展到增加使用或添加一些更多的相关功能。很多已经努力得到更高的精度和范围存在巨大的发展中新的特征提取技术,提高识别精度或修改现有的特征提取技术。 |
表乍一看 |
|
表1 |
|
|
数据乍一看 |
|
|
引用 |
- 老爷Trung阮,“自适应分类器结构:一个手写数字识别方法”,J.J. Alpigini et al。(Eds): RSCTC, LNAI 2475年,斯普林格出版社柏林海德堡,578 - 585年,2002页。
- t Vasudev G Hemanthkumar, p . Nagabhushan Arc-Form-Text线性形式的文本转换适用于OCR”,模式识别字母,28卷,问题16日pp.2343 - 2351, 2007。
- Sonka M。,Hlavac V., Boyle R., “Image Processing Analysis and Machine Vision”, 2nd Edition, 1999.
- 陈m . Y。,茶室。,周J。,“Offline Handwritten Word Recognition Using HMM Type Stochastic Network”, IEEE Transaction of Pattern Analysis and Machine Intelligence, 16, 481-496, 1994.
- Saula J。,Pietikainen M., “Adaptive Document Image Binarization”, Pattern Recognition, vol. 33, issue 2, 2000.
- Dayashankar辛格,桑杰Kr。辛格博士(太太)MaitreyeeDutta,“手写字符识别使用十二定向特性输入和神经网络”,国际期刊《计算机应用,卷1 - 3号,2010年。
- Anita Pal, Dayashankar辛格“使用神经网络英语手写字符识别”国际期刊的计算机科学和通信期2号、141 - 144页,2010年。
- m·k·穆罕默德Altahaf m b女王“手写字符模式识别使用神经网络计算和控制工程国际会议,2012。
|