在线刊号(2278-8875)印刷版(2320-3765)
基于ICA方法的图像二值化光学字符识别
图像二值化在OCR应用中的文本分割中起着至关重要的作用。退化图像中的文本二值化是一项具有挑战性的任务,由于文本的颜色、大小和字体的变化,结果往往受到复杂背景、不同光照条件、阴影和反射的影响。对这一问题的鲁棒解决方案可以显著提高场景文本识别算法的准确性,从而实现场景理解、自动定位、导航和图像检索等各种应用。在本文中,我们提出了一种从包含复杂背景的图像中提取和二值化文本的新方法。我们使用基于独立成分分析(ICA)的技术来绘制本质上均匀的文本区域,同时去除背景中包含的阴影、镜面和反射。该算法对不同退化程度的图像效果更好。我们在DIBCO数据集上实现了我们的方法,然后我们将我们的鲁棒算法与基于Otsu方法的二值化等最先进的标准进行了比较,我们可以证明我们的算法会给出更好的结果。
M. Jyostna Grace, K. Subhashini