所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

基于混合特征提取的手写体字符识别SVM分类中的多类误用

Dr.Kathir.Viswalingam1, G.Ayyappan2
  1. 印度金奈巴拉特大学院长(研发)1
  2. 印度金奈巴拉特大学信息技术系助理教授2
有关文章载于Pubmed谷歌学者

更多相关文章请访问国际计算机与通信工程创新研究杂志

摘要

在本文中,我们倾向于描述离线书写字符识别的混合特征提取。预计的技术可能是结构、应用数学和相关选项的混合。在开口中,投影技术确定了角色中一些基本笔画的种类和位置。要寻找的笔画包括水平、垂直、正倾斜和负倾斜的线条——正如我们倾向于观察的那样,任何字符的结构通常都是由直接的线条笔画混合而成的。笔画是通过将汉字的完全不同的部分与选定的基本形状相关联来确定的。这些在完全不同的字符部分的标准化相关值提供了相关选项。为了创建更强的特征提取,我们倾向于在第二步中为相关性选项添加确定的结构/统计选项。附加的结构/统计选项是支持投影,轮廓,不变矩,端点和结点。这种增加的、强大的选项组合导致每个角色都有157个变量的特征向量,我们发现这足以明确地表示和确定每个角色。在此之前,书面字符识别的缺点还没有被我们的混合特征提取技术解决。 The extracted feature vector is employed throughout the coaching section for building a support vector machine (SVM) classifier. The trained SVM classifier is after used throughout the testing section for classifying unknown characters. Experiments were performed on written digit characters and uppercase alphabets taken from completely different writers, with none constraint on style. The obtained results were compared with some connected existing approaches. Attributable to the projected technique, the results obtained show higher potency concerning classifier accuracy, memory size and coaching time as compared to those different existing approaches.

关键字

采购产品路由协议,医疗保健,节点,传感器节点,无线传感器网络。

介绍

手写体字符识别(HCR)是指在pc机上主要识别的书写数字和字母。HCR可能是人类与机器互动自动化的一步。HCR应用于帮助视障人士;用于自动记录信息和过滤书面文件;作者识别、签名验证等[1]。尽管HCR的应用范围非常广,但由于每个作者都有自己的文字写作方法,每个作者的写作方式也各不相同,所以HCR是一项很麻烦的对象分类任务。
A)特征提取与关联工作:
在成功实现字符识别的过程中,最必要的一个阶段就是特征提取。特征提取阶段从字符中识别和提取各种属性,便于清晰、明确地区分完全不同的字符。根据不同的字符表示,文献中提出了一系列完全不同的特征提取方法。作为一个例子,已经概述了完全不同的选项集,以最好地表示字符形状,边界,他们的骨架和笔画等不同类型的选项和方法的字符识别任务。其中有应用数学特征提取器和结构特征提取器。应用数学选项考虑到值的排列。用于书写字符识别任务的应用数学选项主要包括分割、投影、轮廓和交叉等。结构选项考虑了字符样本的纯数学和拓扑结构,如循环范围、端点、结点、比率、笔画种类及其方向等。一些特征提取方法主要是基于完全不同的工作站,如基于傅里叶变换、波纹重做、中心矩、泽尼克矩等。在[3]中,作者描述了一个基于部分化的特征提取器,以识别印度坎那达文字的书面数字。 Authors in [4] acknowledge written numerals mistreatment Fourier descriptors and neural network. In [5], the authors acknowledge Chinese written characters mistreatment gradient and rippling based mostly options. In [6], the authors extract moment based mostly options so as to acknowledge written Arabic letters. They use genetic rule for feature choice and use SVM to assess the classification error for the chosen feature set.
目前的趋势是,将从固定特征的不同表示中提取的各种选项结合起来,而不是专门用特征向量来支持一个人的性格的一个说明。混合和利用这种完全不同形式的选项的好处是,它可以提供更广泛的识别线索,以提高识别的准确性。作为一个例子,Heutte等人[7]混合了完全不同的应用数学和结构选项来识别书面字符。他们构建了一个包含124个变量的特征向量,包括以下7个特征家族:1)特征与水平和垂直直线的交点,2)不变矩,3)孔和袋状弧,4)极值,5)终点和连接点,6)轮廓,7)投影。混合完全不同的特征提取技术,如交集基于大多数选项,阴影选项,链代码和印度Devnagari语言脚本的曲线拟合选项。
B)模式分类与关联工作:
成功实现书面字符识别的第二个最必要的部分是模式分类阶段。该阶段利用特征提取阶段的数据,将关联的未知字符样本分配到至少一个潜在类别中。不同种类的分类器通常根据知识样本的特征和种类以及提取的选项来设计。用于字符下行识别的分类器有k-最近邻分类器、隐式安德烈-马尔科夫模型(HMM)、支持向量机(SVM)和人工神经网络(ANN)等。Jain等[10]提供了应用数学模式识别技术的综述。在[11]中,Pal和Singh训练神经网络承认支持字符边界傅里叶描述符的大写字母作为选项。在[12]中,基于对角线选项的书写字母识别是自寻址的。在[13]中,Shubhangi和Hiremath通过提取支持向量机分类器的结构小选项来识别英语书写字符和数字。Nasien等人[14]另外使用SVM分类器通过使用freewoman链代码来识别书面字母,因为选项。在[15]中,Train等人承认重音书面法语字符支持混合结构和矩选项的SVM分类器。 In [16], Liu and Nakagawa offer a review of learning ways for nearest neighbor classifiers. [17] and [18] build HMM to acknowledge, severally, offline written Chinese characters and on-line English characters.
C)礼物工作:
在本文中,我们倾向于提出一种完全不同的混合特征提取技术,其中包括100个相关选项和另外57个结构/统计选项。我们的相关选项支持Pearson?S相关[19-20]被广泛应用于测量照片之间的相似性或不相等性。相关常数的值表示两张照片相似的程度。这里,请求皮尔逊的申请?S的相关性以一种完全不同的方式决定了书写中的基本笔画。为此,我们倾向于计算出完全不同的字符段之间的相关常数,从而选择基本形状。我们倾向于在频域重新加工字符图像,然后我们倾向于标准化它们的能量值,因为在信号处理理论中,抽象域的相关性仅仅是频域的乘法,这是一个有文献记载的现实。Shioyama和Hamanaka[21]提取了相似的基于多选项的中文手写体字符识别。它们只执行它们的分类支持的最小距离调用规则。 We, on the contrary, perform final classification supported support vector machine (SVM). the largest challenge, in achieving high accuracy results for SVM classification issues, is the extraction of sturdy options from the info samples. perform is based mostly on power spectral density of character pictures, it's invariant underneath a translational rework and thus will absorb the native variation in hand-printing. during this paper, we tend to take a look at the appliance of this correlation perform based mostly approach to the domain of English written alphabets and numerals. To the simplest of our data, such quick Fourier rework (FFT) based mostly correlation approach has not been nonetheless applied for the classification of English written character samples, although some important work on fuzzy rules based mostly identification of lines and curve strokes within the characters will exist [22-23].
在我们自由书写的字符识别缺点的情况下,这些相关选项本身并不能为SVM分类提供令人满意的准确性。为了创建更强的特征向量,对于更高的特征特征的识别能力,我们倾向于将基于相关性能的选项与各种结构或应用数学选项混合使用。一些结构性未覆盖选项是我们倾向于添加到相关选项中的结束点和连接点。最后,我们倾向于在相关选项中添加配置文件、投影和时刻选项,因为这些选项主要基于字符的二进制图片,而相关选项支持骨架化字符。
D)预测方法:
我们的计划工作提出了一个完整的书面字符识别器。该系统通常分为3个阶段:a)预处理,b)投影特征提取主题,c)基于svm的训练和分类。下面我们将详细描述每一个子阶段。
这些选项是从稀释的字符中提取出来的。结束点是那些只有一个邻居的点,而连接点至少有三个邻居。我们倾向于选择结束点的数量,连接点的数量,因此,这些点的x-y位置,因为要坚持的选项。由于结束点和连接点的数量会因字符类型的不同而不同,我们需要一些策略来将这些选项转换为固定的长度向量。为此,我们倾向于使用[7]的策略。大部分终点和连接点的范围,称为p,从教练信息中记录下来,并计算它们与对应的x-y位置的平均值。如果任何字符只有p个点,则特征向量中的空行被典型值填充。如果在整个测试部分中,字符恰好拥有比p更大的点数范围,那么额外的点数就会被丢弃。这些选项中的一个在vary[0,1]中标准化。

主要基于分类的SVM

特征提取阶段完成后,我们的下一节是在所有信息样本的提取特征向量上进行关联智能分类器。在分析过程中,我们选择了支持向量机分类器进行训练和分类。支持向量机可以是一个2类分类器,它通过计算两个类别之间的最大边际边界来分离两个类别的信息样本。这个分离边界的答案是在数学优化下行的类型中表示的,它在支持向量机文献[29]中得到了很好的建立。在信息是非线性可分割的情况下,支持向量机对核函数进行了处理,使得信息是线性可分割的。内核执行程序将输入信息模式映射到某个高维区域,以创建高维区域中线性可分割的点。常用的用于分类的核函数有数学家的径向基函数、双曲正切函数、多项式核函数等。两个类别之间的分离边界概括为调用边界,称为支持向量(SV)。这些SV验证了分离超平面。二元支持向量机类别规范的缺点将通过构建各种2类支持向量机分类器{针对不同}类对进行完全不同的|,然后基于不同的方式进行最终的分类调用,如最大赢策略、赢者通吃策略等。 Max-wins strategy is that the majority-voting call of all the 2- category SVM classifiers. In winner-takes-all strategy, the binary classifier with highest output perform takes the call of classification. Common existing approaches [30-32] for multi-class classification downside are oneagainst- one (OAO), one-against-all (OAA), binary tree of SVM and directed acyclic graph (DAG) etc. during this analysis, we tend to have chosen OAO technique for multi-class classification.

结果,分析和讨论

我们在30个完全不同的作者的文字上测试了这种技术,世界卫生组织允许以他们自然流行的方式将这些文字写成文字。整个系统在MATLAB中实现。在预处理阶段,我们倾向于从扫描文档中提取完整的6092个大写字母和2279个数字。信息样本分为两部分:三分之二的知识样本用于指导目的,而简单部分的知识样本用于测试目的。因此,字母辅导信息由4067个字符组成,而字母测试信息由2025个字符组成。同样,数字辅导信息由1857个数字组成,而数字测试信息由922个数字组成。提取157维的特征向量,用于书写字符和数字的训练信息。其中一个支持向量机模型在字母的157 4067个特征矩阵上训练,另一个支持向量机模型在书写数字的157 1857个特征矩阵上训练。支持向量机参数对教练信息进行了微调,并进行了3次交叉验证。一旦训练了书面字母和数字的支持向量机模型,我们倾向于在保留的测试信息集上检查流行度系统的性能。 Out of the testing information, solely 32/922 digits and 80/2025 alphabets were misclassified. this provides ninety six.5% recognition accuracy on chosen digits information and ninety six recognition accuracy on chosen alphabets information. The system showed 100% accuracy on coaching information of each alphabets and numerals. Its coaching time and memory size of found classifier is way less compared to the opposite 2 approaches. The system has additionally higher recognition rate as compared to different 2 approaches. we tend to more examined the performance of our system on information samples of a new author not originally among the thirty writers on whom the system was trained and tested. show performance of the system on this new author. we tend to ascertained throughout the feature extraction stage that the dilution method generally eliminates necessary character strokes that cause some characters to induce misclassified. The system performance will so be more improved by purification the dilution stage.

进一步分析

我们的投影混合特征提取技术结合支持向量机分类器在书写数字和大写字母上表现出了智能性能。今后,我们将着眼于投影技术在字素字母上的表现。为了在微小字符上获得令人满意的精度,我们的混合技术可能会改变窗口大小和基本段的形式,如果必要的话,还会改变一些小的针对字素字符的结构选项。

结论及未来工作

本文提出了一种基于混合特征提取技术的完整的脱机手写字符识别系统。该系统主要包括预处理、特征提取和基于训练/分类的支持向量机3个阶段。投影混合特征提取技术,作为实验公开,建立以捕捉本地和国际变化的书面字符设计。提取的特征向量是基于选项和一些统计/结构选项的相关性能的混合。

参考文献












全球科技峰会