EM系统所有提交文件重定向 在线手势提交系统.请求作者直接向文章提交 在线手势提交系统相关日志

线段段使用线程

ashu库马尔#1simpelRani金德尔2银河Singla3
  1. CSE系,Yadwindra工程学院,印度旁遮普TalwandiSabo
  2. CSE系,Yadwindra工程学院,印度旁遮普TalwandiSabo
  3. CSE系Bhai Maha Singh工程学院SriMuktsarsaib,印度旁遮普
对应作者 :ashu库马尔电子邮件:ashu.software.engineer@gmail.com
相关文章at普梅德,学者谷歌

访问更多相关文章计算机科学全球研究杂志

抽象性

文本线分割是重要的一步,因为不准确分割文本线将导致识别阶段错误文字线分割手写文档仍然是开发可靠的OCR最复杂问题之一字性使得文本线分割过程极具挑战性文本特征可因字体、大小、定向、对齐、颜色、对比度和背景信息而异变异转词检测过程复杂难易手写文本可视用户技能、处理方式和文化背景而大相径庭片面投影技术与轮廓追踪段手写文档显示为单行文本拟方法强处理线性波动

关键字

OCR,线分解,直方图,块块,分片分行,潜在PSL

导 言

大量研究研究 识别Gurmukhi脚本光字符识别系统分片阶段很重要,OCR精度在很大程度上取决于分片阶段不正确分治导致错误识别分割相包括线性词性分割字字符分割前执行线分割查找输入文档图像中行数和线边界不正确的线分割可能导致识别精度下降
关于手写文本线段分割问题,可提供勘测论文[1、2]大量工作已分段编译罗马脚本,并有多种并开发良好的技术[3-7]Idic脚本工作微乎其微,例如Devnagri、Bengali、Gurmukhi等只有少数论文可用分割手写Indic脚本[8-11]
最简单最常用分行法是横向投影线间差作线界这种方法对偏斜、浮动或近似图像效果不好此处,我们正在修改方法 段文本线基于直方图投影图一二和图三显示三种样本文档执行线段分割其余论文组织如下第二节描述线分割问题第三节描述拟提议方法实验和结果在第4节中讨论,随后在第5节中得出结论

构件挑战

处理手写文本时,线分割必须解决现代印刷文本中不常见的一些障碍最突出的是:
偏斜行数:文本泛非直线
图像显示
轮廓线 :
图像显示
线近点:相邻文本线间小差点将引起线与线几何特征不规则性分量相触和重叠,通常是字或字母相重叠,如线宽度、高度、字行距离、最左方位置等
图像显示

提议方法

文本线分割有几种方法大致分类如下阻击方法、横向投影、Hough变换、令人反感有吸引力网络、随机法和文本线结构增强[1.2]手写文本线分割方面有许多挑战,尽管提出了许多方法,问题仍未解决。
横向预测无法很好处理斜线、曲线线和浮动线横向投影法全文本适合用直线分割文本并用大线隔行例例见Fig12+3
hp零分行为PSL几行HP为0接连排第一排是PSL文本块的PSL显示在Fig中5乘水平线
所有这些PSL可能不可用于线段分割我们选择一些潜在的PSL如下算出估计字高度连续两个PSL之间的距离小字高度时,我们删除这两个PSL的上方PSL清除后获取的PSLs为潜在的PSLs图6显示从图5PSL获取的潜在PSL
图像显示
切分此类型文本, 我们正修改方法到段文本线 基于直方图投影连接相交组件时使用轮廓跟踪
开始时,我们将文本划分为垂直宽度W块上块宽度可能不同于WW计算下文讨论下一步,我们从这些块中逐行计算[12]我们计算每个块的横向投影图四显示图像块投影剖面图
图像显示
图像显示
我们存储了每个潜在PSL坐标数组供未来使用通过适当合并这些潜在的PSLs,我们获取单行文本可指出的是,有时由于上线分块与下线分块重叠或触摸,在某些地区我们可能得不到PSL并因古尔穆希修改字符adhak,chandrabindu) 中发现多PSLPSL加入时我们照顾他们 下个解释
图像显示
第一,我们存取每个潜在PSL坐标数组供未来使用通过适当合并这些潜力
PSLs获取单行文本可指出的是,有时由于上线分块与下线分块重叠或触摸,在某些地区我们可能得不到PSL并因古尔穆希修改字符adhak,chandrabindu) 中发现多PSLPSL加入时我们照顾他们 下个解释i+1块加入psl单词高度大概为40-50距离可达字高度3/4通过实验,我们达到了72%的结束
i+1内分块上下游weather并加入基右坐标和PSL左坐标指针均加增1if它不存在,如果PSL位于下方,我们向右横向扩展PSLi,直到它达到(i+1)块右界或交叉黑像素PSL数组中值(i+1)插入取指针乘以1
扩展段交叉黑像素分块中(i+1),我们决定追踪分片上行或下行基于此构件的归属性,我们扩展此线,使构件从实行下降容构性检验如下
从相交点到组件上下端点的距离计算允许d1顶端距离和二二底距离和二字高度估计为40ifd1 tword_h8/2和d2>(word_high2)后,我们假设组件触摸下行的另一组件[12]如果组件属于上行(下行),则线沿下端段轮廓扩展(上端段),使组件可以嵌入上行(下行),如图8所示
图像显示
沿轮廓测试8连接性(8个相邻点)。测试连通性,我们已经数出像素0和相邻像素0至8,视轮廓类型而定,不论轮廓上线或下线轮廓上行(下行)轮廓中,我们用时序数像素(逆时钟)方向,如图9所示:
图像显示
估计宽度块表示W为70这是因为如果我们取W=50,它会生成极小块,与构件交叉的可能性更多,如果我们取W=100,块数会少一些,并保护多行段,以防文档文本线彼此非常接近

过程和结果

实验用Gurmukhi脚本中各种手写文本图像进行高斜度图像、小线差、多词差等考虑中。实验中,我们只考虑单列文档页通过查看计算机显示结果,我们人工计算线段精度,检验正确分块组件显示相邻线段线词重叠并高度触摸此示例图8显示,我们试图使用轮廓追踪精度相交分块
图像显示
线分割结果可见表1这种方法也可以应用到其他印地安脚本但它受限为大小依存未来我们计划使用不同尺寸文本部分文档图如下:
图像显示
图像显示

引用

  1. Sulem,Zahour,BrunoTacnet,“历史文档文本线分割:调查”,pp123-138,IJDAR-9,2007年
  2. Razak Mohd,“脱线文字线分割:审查”,pp12-20,IJCSS,2008
  3. Manivannan Arivazhagan,Harish Srinivasan和Sargur Srihari,“手写文档线分割统计方法”,pp1-11,SPIE,2007年
  4. 小军杜武莫潘 天公元前Bui使用Mumford-Shah模型手写文档分页,pp3136-3145模式识别,2009年
  5. Yosef,Nate Hagbi,Dinstein,p1161165ICDAR,2009年
  6. A.Nicolaou和BGatos, pp.626-630,第10ICDAR,2009年
  7. Stephane Nicolas,Thieri Paquet,Laurent Heutte,“手写文档使用制作系统分线”,pp245-250,IWFHR-9,2004
  8. 拉吉夫K夏尔马博士Amardep Singh,Gurmukhi脚本文集,pp12-17,IJIP-11,2008年
  9. M.Hanmandu和Pooja Agrawal,“结构化分割手写印地文方法”,pp589-597,ICCR,2005年
  10. 拉吉夫K夏尔马博士Amardep Singh,Gurmukhi脚本文集,pp12-17,IJIP-11,2008年
  11. NareshGargMK金代尔文集手写印地文1923IJCA2010
  12. NTripathy和UPal,“手写非约束Oriya文本分解”,pp306-311,IWFHR,2004年
  13. Munish,R.K.Sharma和M.K.Jindal,“手写Gurmukhi脚本文档线词分解”,pp25-28IITM-12010
  14. U.Pal和SDatta,Bangla不受约束手写文本分解,pp1128-1132,ICDAR-7,2003年