所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

基于嵌入式技术的图像和视频数据提取

Ms.S.J.Wamane1和T.A.More2
  1. PG学生,E科技部门。Loni C, Pravara农村工程学院,印度马哈拉施特拉邦。
  2. 助理教授,E科技部门。Loni C, Pravara农村工程学院,印度马哈拉施特拉邦。
相关文章Pubmed,谷歌学者

访问更多的相关文章国际创新研究期刊》的研究在科学、工程和技术

文摘

文本数据出现在视频和图像包含有用的信息进行自动索引、解释和构造的图像和视频信息的恢复也很有用和总结这些信息提取通过检测、定位和分割的文本从一个给定的图像,但由于不同风格,不同的文本大小方向,校准和复杂背景使自动文本提取非常困难的问题。提出了许多技术为解决这一问题,本文的目的是分类和评估这些方法和绩效评估。我们提出新方法来检测和提取的文本并提取音频视频场景。系统也使用手臂11单片机实现自动和手动模式用于视频和音频选择。该方法强的性格不同大小、颜色和位置。减少处理时间叠加帧之间的文本区域更新也使用。

关键字

文本检测、文本提取视频信息恢复,视频摘要,手臂11单片机。

介绍

视频编辑技术更发达是因为叠加使用的增加文本插入视频内容为观众提供更好的视觉理解。大多数传播的视频增加使用叠加文字表达更直接的总结语义和提供更好的浏览体验,如标题总结报告在新闻视频和字幕纪录片戏剧帮助观众理解内容。视频运动包含文本描述分数,团队,球员名字或扬声器,位置,一个事件日期等[1]。一般来说,视频文本可以分为场景文本和覆盖文本[2]。自然场景文本出现在背景场景的一部分,如广告横幅、董事会等;而叠加文字叠加在视频场景,用来帮助观众的理解。由于覆盖文本是高度结构化和紧凑,它可用于视频索引和检索[3]。然而,对于视频光学字符重组,覆盖文本提取变得更具挑战性,而OCR任务的提取文本的文档图像,由于复杂的背景所带来的困难,大小、未知文本和颜色等等。前两个步骤主要涉及覆盖进行文字识别,包括检测和提取叠加文字。首先,叠加文字区域与背景进行了区分。确定覆盖文本字符串的精确边界,发现覆盖文本区域是雅致。 Background pixels are removed from the overlay text strings in the extraction step, to generate a binary text image for video OCR. Although many methods have been proposed to detect and extract the video text, small number of method can effectively deal with different shape, color and multilingual text.
我们提出一个新的重叠检测和提取方法来检测和提取文本使用手臂11单片机。首先,我们生成的文本检测算法来检测在线视频或图像使用自动和手动模式。检测后,通过提取算法提取文本的图像或视频,获得的结果将显示在LCD。

系统概述

提出系统的主要目的是为了从视频中提取文本和图像。从视频中提取文本由很多阶段即文本检测、定位和文本提取文本。文本检测是用来识别文本的视频帧的存在而文本定位是用于确定视频中的文本框的位置并生成边界框以显示候选区域。候选人地区是一个框架的一部分,包含文本。在文本提取阶段的文本从帧中提取并传递给OCR字符验证。提出了系统的基于镜头的视频是分裂成帧。通过执行框架相似冗余帧被丢弃导致选择关键帧[8]。关键帧是一个包含了场景文本。在预处理阶段,现有的文本信心是关键帧识别和规模。这个阶段识别区域文本存在即候选区域。 The adaptive thresholding (binarization) is applied to identify the presence of text in the key frame. After the detection of text region, the connected component analysis is performed where both horizontal and vertical projection in the key frame is used to detect the text. The extracted text is passed to the OCR (Optical character recognition) for character confirmation.

提出的方法

从视频文本检测与提取和图像成为提高区域信息资源领域的相关信息需要从信息资源的集合来解决基于内容的视频信息检索的基本问题。检测和提取文本有助于理解视频内容的帮助下文字识别使用光学字符识别(OCR)。
一个)的文本检测方法
文本检测主要用于发现只有图像中的文本区域,可以很容易地突出显示给用户。文本可以被操纵等不同属性的文本字符垂直边缘密度、边缘方向方差或纹理。文本检测的两个主要问题:1)如何避免整个image.2)上执行计算密集的分类如何减少字符大小的差异。为了解决这些问题,我们提出新的文本检测方法,成功地检测叠加文本区域无论颜色、位置、大小、风格,和对比,也存在不同的文本混合在每个图像帧的大小。提出了检测方法的整体过程图1所示。
图像
根据经验法则,如果叠加文字的背景是黑色,然后叠加文本往往是明亮的,反之亦然,因为这短暂的颜色叠加文字及其相邻背景之间存在。因此,在边界强度的对数变化叠加文字[4]。过渡地图可以用作附加文本区域的有用指标。有关地图生成第一代的连接组件。如果阈值大于连接组件,它们是移除。TH值通常是选择通过观察叠加文本区域的最小大小。然后,连接组件是重塑光滑边界[7]。下一步确定真正的附加文本区域取决于文本区域的长宽比。为了更好的精确的文本提取覆盖的文本区域或获得的边界框需要改进。一旦附加文本区域检测到当前帧,然后利用连续帧之间的叠加的连续性文本的文本区域检测下一帧[5]。 If the difference obtained by XOR of current transition map and previous transition map, is smaller than a predefined value, the superimposed text regions of previous frame are directly applied as the detection result without further refinement.
B)文本提取方法
文本提取用于将一个文本区域的灰度图像转换成准备好了二进制图像中所有的字符图像元素在黑色和其他人在白色的。文本提取的三个主要问题:1)未知的颜色极性意味着文本是否光明或黑暗2)复杂的背景和3)各种笔画宽度。要解决这些问题我们提出新的文本提取系统。文本提取系统的整体过程是图2所示。
图像
文本提取方法分为两组即基于中风和基于颜色的方法。精制叠加文本区域转换为二进制图像中所有图片元素叠加组成的文本突出显示和其他有人居住。因为第一,每个叠加文本区域由两个像素扩展更广泛的开发背景的连续性。扩大外部区域用。在下一步的比较图片元素在文本区域和ER的像素,这样像素连接到扩展区域可以消除[6]。文本区域表示像ETR TR和扩大文本区域。接下来,自适应基于滑动窗口的股权进行水平和垂直方向不同窗口大小,分别。最后,纠正字符从每个叠加得到文本区域内填充[7]。

系统的框图

系统的框图见图3
图像
我们实现硬件检测和提取数据从图像和视频。实现系统运行两种模式即自动模式和手动模式。这两个模式主要用于选择在线或存储在电脑视频或音频。在自动模式或任何在线视频或音频存储在电脑上选择然后为了检测文本,视频,它分为帧,然后检测并提取利用提出的方法;而在手动模式在线视频或任何视频存储在电脑上手动选择文本检测和提取。ARM11单片机与PC机接口。手臂11是一个家庭的Arm架构的32位RISC微处理器cores.VB.net用于编码在手臂11单片机检测和提取文本在任何网络或存储视频的电脑。后再次回滚数据到个人电脑和液晶显示。外部存储器用于存储获取的结果。

结论

文本检测的新方法,提出了从视频中提取和图像。使用手臂11单片机系统实现。两种模式主要用于图像和视频选择包括自动和手动模式。视频分为框架和关键帧。文本区域开发指标计算文本现有的信心和候选区域进行二值化。C或C编译器是用来编码在手臂11单片机和VB.net用于数据提取,最终得到的结果将显示在LCD。各种视频检测验证的性能检测和提取方法。该方法主要适用于实时应用程序。扩大更高级的算法和智能应用程序,我们的未来的工作是检测和提取叠加移动文本。

引用

  1. c .通用杖鱼和m .烦恼”,时间间隔基于最大熵的事件索引在足球视频中,“在Proc, Int。相依多媒体和世博会,2003年7月,3卷,第481 - 484页。
  2. r . j . Gllavata Ewerth, b . Freisleben”基于非监督分类的文本检测在图像的高频小波系数,“在Proc, Int。相依,模式识别,2004年8月,1卷,pp.425 - 428。
  3. j .赵宋,崔和b”韩国闭路的新闻视频检索使用自动索引,“课堂讲稿在计算机科学中,卷。2945年,第703 - 694页,2004年8月。
  4. l . Agnihotri克里斯汀娜和n”文本检测视频分析,“Proc。IEEE Int.Workshop在基于内容的图像和视频库的访问,1999年6月,第109 - 113页。
  5. x s, p .阴,h . j .张“高效的视频文字识别使用多个框架集成,“在Proc, Int。设计,图像处理,9月。2004年,2卷,页22日至25日。
  6. k c k金et al .,“场景自然场景图像文本提取使用分层特性结合和验证,“在Proc, Int。相依,模式识别,2004年8月,2卷,第679 - 682页。
  7. Wonjun金;部门的电子。Eng。,Inf.& Commun. Univ.,Changick Kim; Daejeon, “A New Approach for Overlay Text Detection and Extraction from Complex Video Scene” 2009 IEEE.