比较文本提取技术审查

基拉迪夫¹,Neelu贾殷²

我学者,E和C的部门,派克科技大学、昌迪加尔、印度
副教授,E和C的部门,派克科技大学、昌迪加尔、印度

文摘

文本图像中包含重要的信息索引和检索内容,自动注释和结构的图像。因此文本提取是图像分析的关键阶段。文本提取算法所涉及的步骤检测、定位、二值化、提取、增强和识别的文本图像。文本提取是一项非常具有挑战性的任务,由于变化的文本大小,字体,风格,定位和校准以及复杂的背景。基于边缘检测的几个文本提取技术,连接成分分析,形态运营商、小波变换、纹理特征,神经网络等已开发。本文提供了一个审查建议的各种技术研究人员和他们的比较分析的精确率、召回率、检测率等。

关键字

离散小波变换,连接组件,优势,支持向量机,离散余弦变换。

介绍

图像内容分为两类:知觉内容和语义内容[1]。感知内容包括颜色、形状、纹理,强度,和时间变化而语义内容包括对象、事件和他们的关系。文本内容包含高水平的语义信息与视觉信息。因此从文本提取图像内容分析是非常重要的。它有许多有用的应用程序,例如自动银行支票处理[2],车辆牌照识别[3],文档分析和页面分割[4],招牌检测和翻译[5],基于内容的图像索引,帮助视力受损的人,外国人文本翻译系统等。

文本出现在图像划分为三类:文档文本,标题文本和场景文本[6]。标题文本相比,场景文本可以有方向和扭曲的透视投影因此更难检测出场景文本。

吗?文本文档:文档图像(图1)通常包含文本和一些图形组件。是通过扫描日志,打印文档,手写的历史文献,书的封面等

吗?标题文本:也称为覆盖文本或人工文本(图2)。它是人为地叠加在图像编辑的时候,字幕和通常描述图像内容的主题。

吗?场景文本:发生自然场景图像的一部分,包含重要语义信息,如广告、街道名称、机构、商店、道路标志、交通信息、董事会标志、铭牌、食品容器、路牌、广告牌、条幅、文本工具等(图3)。

文本图像的属性:

文本通常有不同的外观由于改变字体,大小、风格、定位、对齐、质地、颜色,对比,和背景。这些变化将使自动文本提取复杂和困难的问题。文字在图片展览变化由于以下属性的差异[7]:

吗?大小:文本的大小可能会有所不同。

吗?对齐:场景文本可能在任何方向对齐和几何失真,标题文本通常水平一致,有时可能出现non-planar文本。

吗?颜色:人物往往有相同或相似的颜色但是低对比文本和背景使得文本提取困难。

吗?优势:大多数文本标题和场景设计很容易阅读,因此导致强烈的文本和背景边缘的边界。

吗?压缩:许多图像记录、传输和处理的压缩格式。因此,可以实现更快的文本提取系统如果没有减压可以提取文本。

吗?变形:由于相机角度的变化,某些文本可能携带的角度扭曲,影响萃取性能。

b .文本提取的过程:

输入图像灰度或颜色,在未压缩的压缩格式。文本检测是指确定文本在图像文本定位的存在是一个过程,确定文本和生成边界框的位置。在那之后,提取文本即从背景中分割出来。增强需要提取文本的文本区域通常有低分辨率和容易产生噪音。之后,可以使用OCR识别提取的文本。文本提取的框图,图4所示。

文本提取技术

文本提取的各种技术是:

答:基于区域的方法:

提出方法使用颜色或灰度的属性在文本区域或分歧的对应属性的背景。它们是基于事实,很少有颜色的变化在文本和这个颜色非常不同于文本的直接背景[20]。文本可以通过阈值的图像强度水平之间直接的文本颜色和背景。

这种方法并不健壮的复杂背景。该方法进一步划分为两个sub-approaches:连接组件(CC)和基于边缘。

我)。基于CC的方法:

CC-based方法使用一个自底向上的方法通过将小部件分组为先后较大的组件,直到所有区域图像中识别(9 - 12)。几何分析需要合并使用这些组件的空间排列的文本组件,以过滤掉非文本组件和文本区域的界限明显。该方法定位定位文本快速但失败对于复杂的背景。

二)。基于边缘的方法:

边缘是一个可靠的文本特性无论颜色/强度、布局、朝向等。边缘方法主要是基于文本和背景之间的高对比度[5,13 - 15]。文本嵌入在图像的三个显著特征,可用于检测文本边缘强度、密度和方向方差。Edgebased文本提取算法是一种通用的方法,该方法可以快速、有效地定位和提取的文本文档和室内/室外图像。这种方法并不健壮的处理大尺寸文本。

b .基于纹理的方法:

这种方法使用文本图像离散结构的属性和背景区别开来。的技术基于伽柏过滤器、小波、快速傅里叶变换(FFT),空间方差等用于检测图像中的文本区域的文本属性(16 - 19)。该方法能够检测复杂背景中的文本。唯一的缺点该方法的计算复杂度大的纹理分类阶段。

c .基于形态学的方法:

数学形态学是一种基于拓扑和几何图像分析方法(16、17、20)。形态特征提取技术已经有效地应用于字符识别和记录分析。它是用来提取重要的文本处理图像对比功能。这些特性对各种几何图像变化不变的翻译、旋转和缩放。即使在闪电条件或改变文本颜色,功能仍能保持。这个方法工作强劲变化在不同的图像。

性能分析

答:各种参数用于分析文本提取技术和给定的性能:

b .比较分析相关的工作:

许多研究已经完成在各种文本提取技术,如基于区域(CC和基于边缘的),这些技术的基于纹理的,基于形态或者组合(即混合方法)。研究人员使用不同类型的图像的实验。文本提取技术的详细分析如表1所示。

结论

在这篇文章中,各种技术,如基于区域的边缘,连接组件(CC)为基础,基于纹理的,讨论了基于形态等,这些技术的详细比较的基础上,各种参数如精确率、召回率、精度等已经完成。每个方法都有自己的好处和限制。尽管数字的算法有很多,没有统一的方法,适合所有应用程序由于字体的变化,大小、对齐、复杂背景的文本等等。得出基于纹理的方法可以检测和本地化文本准确即使图像是嘈杂的,复杂的背景和低分辨率。

表乍一看

表1

数据乍一看


图1	图2	图3	图4

引用

香港金有效的自动文本定位方法和基于内容的视频数据库的索引和组织卷,《VisualCommunication和图像表示。7。4,1996年,页336 - 344。

d . c . y .孙l . Lam Guillevic, n . w . Strathy m . Cheriet j . n .说,r .风扇,银行支票处理系统、国际期刊成像系统和技术,7卷,4号1996,页392 - 403。

科学博士Kim S.I.简,自动汽车车牌提取使用修改后的广义对称变换和图像扭曲国际研讨会工业电子学报,3卷,2001年,页2022 - 2027。

A.K. Jain, y中,使用纹理分析页面分割、模式识别、卷。29日,5号,爱思唯尔,1996年,页743 - 770。

T.N. Dinh, j .公园和李9低文本提取韩国招牌为移动应用程序,IEEE InternationalConference在计算机和信息技术,2008年,页333 - 337。

问:你们问:黄,w .高,d .赵快速和可靠的文本检测在图像和视频帧,图像和视觉计算,23卷,没有。6,爱思唯尔,2005年,页565 - 576。

d .佳n . Jain比较各种图像文本提取技术审查,国际期刊的图形& ImageProcessing 3卷,3号,2013年,页210 - 218。

d . Zaravi h . Rostami a . Malahzaheh年代。Mortazavi,文本提取使用小波阈值和新的投影概要文件,WorldAcademy科学、工程和技术,5卷,2011年,页528 - 531。

第2 J.L.姚Y.Q. Wang翁,Y.P.杨定位文本连接组件和支持向量机的基础上,国际会议OnWavelet分析和模式识别,3卷,2007年,页1418 - 1423。

m·库马尔Y.C.金姆和9李,文本检测使用多层分离在实际场景图像,10日IEEE国际Conferenceon计算机和信息技术,2010年,页1413 - 1417。

y, b, c . Wang c .史一个新的文本提取方法将本地信息,国际会议在手写识别onFrontiers, 2012年,页252 - 255。

h . Raj r·戈什梵文字母文本提取从自然场景图像,2014年国际会议上的进步计算、通信和信息(ICACCI), IEEE, 2014年,页513 - 517。

9 A.N. Lai李,由当地k - means聚类对韩国文本提取二值化,IEEE研讨会上信号处理与信息技术,2008年,页117 - 122。

h . Anoual d . Aboutajdine S.E. Ensias, A.J. Enset,特征提取的文本检测和定位,第五届国际Symposiumon I / V通信和移动网络,IEEE, 2010年,页1 - 4。

S.V. Seeri Giraddi和Prashant。b M,埃纳德语文本提取的新方法国际会议论文集,页onPattern识别、信息学和医学工程,2012年,页444 - 448。

翁Z.J. X.W.张X.B.郑,文本提取算法在背景图像利用小波变换,IEEE研究进展国际会议上小波分析和模式识别,1卷,2008年,页200 - 204。

s . Audithan RM。Chandrasekaran,从文档中提取文档文本图像使用Haar离散小波变换、科研EuropeanJournal 36卷,第4期,2009年,页502 - 512。

s . a . Angadi m . m . Kodabagi从低分辨率自然场景文本区域提取图像使用纹理特性,IEEE 2 ndinternational预先计算会议,2010年,页121 - 128。

抗议Azadboni,答:Behrad、文本检测和彩色图像的特征提取方法利用FFT域滤波和SVMClassification,6日电信国际研讨会。IEEE 2012,页794 - 799。

s . Hassanzadeh h . Pourghassem快速标志检测基于文档图像的形态学特征,2011年IEEE 7日InternationalColloquium对信号处理及其应用,2011年,页283 - 286。

y的歌,a . Liu l .彭日成林,y,唐,一种新颖的图像文本提取方法基于k - means聚类SeventhIEEE /埃西斯计算机与信息科学国际会议上,2008年,页185 - 190。

w .风扇,j .太阳,y福,y Hotta, s . Naoi文本检测基于灰度图像分解和中风提取,中国模式识别会议上,IEEE 2009,页1 - 4。

n . Anupama c . Rupa静电的Reddy,字符分割为泰卢固语图像文档使用多个柱状图预测GlobalJournal计算机科学与技术,13卷,2013年,16页。