所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

比较文本提取技术审查

基拉迪夫1,Neelu贾殷2
  1. 我学者,E和C的部门,派克科技大学、昌迪加尔、印度
  2. 副教授,E和C的部门,派克科技大学、昌迪加尔、印度
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

文本图像中包含重要的信息索引和检索内容,自动注释和结构的图像。因此文本提取是图像分析的关键阶段。文本提取算法所涉及的步骤检测、定位、二值化、提取、增强和识别的文本图像。文本提取是一项非常具有挑战性的任务,由于变化的文本大小,字体,风格,定位和校准以及复杂的背景。基于边缘检测的几个文本提取技术,连接成分分析,形态运营商、小波变换、纹理特征,神经网络等已开发。本文提供了一个审查建议的各种技术研究人员和他们的比较分析的精确率、召回率、检测率等。

关键字

离散小波变换,连接组件,优势,支持向量机,离散余弦变换。

介绍

图像内容分为两类:知觉内容和语义内容[1]。感知内容包括颜色、形状、纹理,强度,和时间变化而语义内容包括对象、事件和他们的关系。文本内容包含高水平的语义信息与视觉信息。因此从文本提取图像内容分析是非常重要的。它有许多有用的应用程序,例如自动银行支票处理[2],车辆牌照识别[3],文档分析和页面分割[4],招牌检测和翻译[5],基于内容的图像索引,帮助视力受损的人,外国人文本翻译系统等。
文本出现在图像划分为三类:文档文本,标题文本和场景文本[6]。标题文本相比,场景文本可以有方向和扭曲的透视投影因此更难检测出场景文本。
吗?文本文档:文档图像(图1)通常包含文本和一些图形组件。是通过扫描日志,打印文档,手写的历史文献,书的封面等
吗?标题文本:也称为覆盖文本或人工文本(图2)。它是人为地叠加在图像编辑的时候,字幕和通常描述图像内容的主题。
吗?场景文本:发生自然场景图像的一部分,包含重要语义信息,如广告、街道名称、机构、商店、道路标志、交通信息、董事会标志、铭牌、食品容器、路牌、广告牌、条幅、文本工具等(图3)。
文本图像的属性:
文本通常有不同的外观由于改变字体,大小、风格、定位、对齐、质地、颜色,对比,和背景。这些变化将使自动文本提取复杂和困难的问题。文字在图片展览变化由于以下属性的差异[7]:
吗?大小:文本的大小可能会有所不同。
吗?对齐:场景文本可能在任何方向对齐和几何失真,标题文本通常水平一致,有时可能出现non-planar文本。
吗?颜色:人物往往有相同或相似的颜色但是低对比文本和背景使得文本提取困难。
吗?优势:大多数文本标题和场景设计很容易阅读,因此导致强烈的文本和背景边缘的边界。
吗?压缩:许多图像记录、传输和处理的压缩格式。因此,可以实现更快的文本提取系统如果没有减压可以提取文本。
吗?变形:由于相机角度的变化,某些文本可能携带的角度扭曲,影响萃取性能。
b .文本提取的过程:
输入图像灰度或颜色,在未压缩的压缩格式。文本检测是指确定文本在图像文本定位的存在是一个过程,确定文本和生成边界框的位置。在那之后,提取文本即从背景中分割出来。增强需要提取文本的文本区域通常有低分辨率和容易产生噪音。之后,可以使用OCR识别提取的文本。文本提取的框图,图4所示。

文本提取技术

文本提取的各种技术是:
答:基于区域的方法:
提出方法使用颜色或灰度的属性在文本区域或分歧的对应属性的背景。它们是基于事实,很少有颜色的变化在文本和这个颜色非常不同于文本的直接背景[20]。文本可以通过阈值的图像强度水平之间直接的文本颜色和背景。
这种方法并不健壮的复杂背景。该方法进一步划分为两个sub-approaches:连接组件(CC)和基于边缘。
我)。基于CC的方法:
CC-based方法使用一个自底向上的方法通过将小部件分组为先后较大的组件,直到所有区域图像中识别(9 - 12)。几何分析需要合并使用这些组件的空间排列的文本组件,以过滤掉非文本组件和文本区域的界限明显。该方法定位定位文本快速但失败对于复杂的背景。
二)。基于边缘的方法:
边缘是一个可靠的文本特性无论颜色/强度、布局、朝向等。边缘方法主要是基于文本和背景之间的高对比度[5,13 - 15]。文本嵌入在图像的三个显著特征,可用于检测文本边缘强度、密度和方向方差。Edgebased文本提取算法是一种通用的方法,该方法可以快速、有效地定位和提取的文本文档和室内/室外图像。这种方法并不健壮的处理大尺寸文本。
b .基于纹理的方法:
这种方法使用文本图像离散结构的属性和背景区别开来。的技术基于伽柏过滤器、小波、快速傅里叶变换(FFT),空间方差等用于检测图像中的文本区域的文本属性(16 - 19)。该方法能够检测复杂背景中的文本。唯一的缺点该方法的计算复杂度大的纹理分类阶段。
c .基于形态学的方法:
数学形态学是一种基于拓扑和几何图像分析方法(16、17、20)。形态特征提取技术已经有效地应用于字符识别和记录分析。它是用来提取重要的文本处理图像对比功能。这些特性对各种几何图像变化不变的翻译、旋转和缩放。即使在闪电条件或改变文本颜色,功能仍能保持。这个方法工作强劲变化在不同的图像。

性能分析

答:各种参数用于分析文本提取技术和给定的性能:
图像
图像
图像
图像
b .比较分析相关的工作:
许多研究已经完成在各种文本提取技术,如基于区域(CC和基于边缘的),这些技术的基于纹理的,基于形态或者组合(即混合方法)。研究人员使用不同类型的图像的实验。文本提取技术的详细分析如表1所示。

结论

在这篇文章中,各种技术,如基于区域的边缘,连接组件(CC)为基础,基于纹理的,讨论了基于形态等,这些技术的详细比较的基础上,各种参数如精确率、召回率、精度等已经完成。每个方法都有自己的好处和限制。尽管数字的算法有很多,没有统一的方法,适合所有应用程序由于字体的变化,大小、对齐、复杂背景的文本等等。得出基于纹理的方法可以检测和本地化文本准确即使图像是嘈杂的,复杂的背景和低分辨率。

表乍一看

表的图标
表1

数据乍一看

图 图 图 图
图1 图2 图3 图4

引用