所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

基于字母数的正弦灰度变化的文本水印

Jeebananda熊猫1尼桑特·古普塔2, Parag Saxena3., Shubham Agrawal4Surabhi Jain说5,问巴塔查里亚6
  1. 印度德里科技大学欧洲经委会系副教授
  2. 印度德里科技大学欧洲经委会系研究生
  3. 印度德里科技大学欧洲经委会系研究生
  4. 印度德里科技大学欧洲经委会系研究生
  5. 印度德里科技大学欧洲经委会系研究生
  6. 印度德里科技大学欧洲经委会系教授
有关文章载于Pubmed谷歌学者

更多相关文章请访问国际计算机与通信工程创新研究杂志

摘要

本文提出了一种不易察觉的脆弱文本水印算法。文本文档中每个字母的字体颜色根据正弦函数的灰度变化。相同的振幅是使用哈希函数生成的。通过将文档中字母的实际颜色值与正弦函数生成的期望值进行比较,可以验证接收到的文档的真实性。该方案对各种与篡改文本相关的恶意攻击高度敏感,因此可以保持文档的完整性。与以前的方法不同,所提出的算法在保持水印不可见性的同时提供篡改检测。攻击分析表明,该方案是有效和安全的。

关键字

灰度图;正弦波;文本水印;数字水印;哈希函数;篡改检测

介绍

互联网和网络技术在现代通信中日益重要的作用引起了人们对数字信息安全的关注。移动设备(如闪存盘、存储卡、ipod等)的更广泛使用使得大量文本材料可以通过这些渠道传输,使它们面临抄袭、侵犯版权、重新分发和其他形式的恶意攻击。在图像、视频和音频水印领域已经做了大量的工作;在文本水印领域的研究相当有限。电子商务、电子商务和数字图书馆的发展增加了对高效文本水印技术的需求。多年来,人们使用加密、隐写术和水印等方法来解决这些问题。数字水印是近年来出现的一种更有优势的方法。这种方法比其他方法更可取,因为它在保证文档的真实性和完整性的同时保持了文档的可理解性。所提出的算法是基于字体颜色值的变化,它遵循正弦函数。在文本的一段上实现哈希函数以生成正弦函数的振幅值。 The algorithm is sensitive to any form of tampering attack. The paper is organised into 6 sections. Section II examines the previous related work done in the area of text watermarking. Section III describes the proposed algorithm. Section IV illustrates the implementation of the same. Section V describes the experimental results and Section VI lists the conclusions

2相关工作

数字水印可以描述为永久嵌入在文档中的识别代码。不可见水印在保存文档的真实性方面更加安全。在过去已经提出了许多技术。这些方法包括使用文本图像的文本水印、基于同义词的文本水印、基于预设的文本水印、基于句法树的文本水印、基于名动词的文本水印、基于单词和句子的文本水印、基于首字母缩写的文本水印、基于错字的文本水印等。文本水印方法分为以下几种。
A.基于图像的方法:
在基于图像的文本水印方法中,水印被嵌入到文本图像中。Brassil等人首先提出了几种利用文本图像[1]-[2]的文本水印方法。之后,Maxemchuk, et al.[3]-[4]对这些方法的性能进行了分析。Huang和Yan[5]提出了一种基于每行平均字间距离的算法。Wiyada Yawai和Nualsawat Hiransakolwong演示了如何利用水平线的交点位置,在横比作用下,在文本图像上虚拟运行文本字符骨架线,作为零水印的标记点[15]。
B.句法方法:
一个句子的组成部分,如名词、动词、介词等,决定了句子的句法结构,这取决于语言及其习惯。利用文本结构上的句法变换嵌入水印也是过去文本水印的方法之一。Mikhail J. Atallah等人首先利用文本[6]-[7]的句法结构提出了自然语言水印方案。Hassan等人对文本进行了形态-句法改变,使其水印为[8]。
C.语义方法:
利用同义词、反义词等文本语义来嵌入水印。Atallah等人在2000年[9]首次提出语义水印方案。后来又提出了同义词替换方法[10]。文中还提出了一种基于名词-动词的文本水印技术,该技术利用语义网络语法分析器解析的句子中的名词和动词。后来Mercan等人提出了一种文本水印算法,利用错别字、首字母缩略词和缩写词嵌入水印[12]。利用介词[13]的语义现象,设计了水印算法。基于文本含义表示(TMR)字符串的算法也被提出[14]。
D.零水印方法:
在零水印方法中,不改变主文本文档来嵌入水印;而是利用文本的特征来生成水印。该水印模式稍后使用模式匹配过程与被篡改文档生成的模式进行匹配,以识别任何篡改[16]。Jalil Z.等人提出了一种基于非元音ASCII字符出现频率的零文本水印算法。嵌入算法利用频率非元音ASCII字符和单词生成一个专门的作者键[17]。Zunera Jalil等人开发了一种算法,该算法利用文本中的关键字(根据作者的选择选择),根据文本[19]中关键字出现的前一个和下一个单词长度生成水印。

3算法

上述技术具有攻击特异性的缺点,在多次攻击时往往变得不可靠。它们也不适用于所有类型的文本文档在随机篡改攻击,并不是专门设计来解决篡改检测问题。提出的算法旨在确保篡改攻击的真实性和完整性,同时还可以识别篡改的位置。
该算法使用文档字体颜色的变化。这种水印技术利用了这样一个事实,即人眼无法察觉颜色的微小变化。文档中每个字母的颜色在灰度范围内呈正弦变化。魏贤敏此前提出了一种基于正弦波的基于字数的水印方案,该方案仅适用于word文档[18]。
在该算法中,原始文本中出现的每个字母的数量决定了整个文本的颜色变化参数。因此,它独立于文档的任何格式,如doc、docx、pdf等,因为算法运行在原始文本上。同样的算法可以很容易地扩展到其他语言,只需要对字母的数量进行轻微的修改。本文提出的数字文本水印技术可用于任何文本文件的知识产权保护
A.水印嵌入过程:
正弦波的振幅是通过对文档的任何选定段落应用SHA-1哈希来生成的。这一段将由发送者和接收者事先决定。这样生成的40位散列的前26个十六进制位用作振幅。前26个十六进制位从产生的40位作为振幅使用。由于这些是十六进制值,因此每个字母对应的正弦波的振幅在1到16之间变化。该算法的代码可以用任何高级语言编写。每个字母出现的次数被记录下来,这被用来计算正弦函数的参数。论点是这样的,正弦波完成了一个周期的总出现的一个字母。不论大小写,所有26种字母都是如此。水印的嵌入使得文本的颜色在0-100的灰度范围内从85到100的灰度范围内变化。 This ensures that the changes in the intensity of the black colour remain imperceptible. The text is read alphabet by alphabet and its colour property is changed according to the sine wave of the corresponding alphabet. In the case of special characters (such as exclamation marks, commas and full stops), the output colour is the same as the preceding alphabet. The document with the embedded watermark is converted to a pdf.
B.篡改检测:
在接收端,从接收到的pdf文档中提取原始文本。嵌入算法再次在原始文本上运行,以生成一个新的水印文档。将生成的文档与接收的文档进行比较。报告的任何不匹配都将表明所接收的文档已被篡改。这两个文档可以通过将它们转换为图像并使用MATLAB等软件进行减去来进行比较。如果文档没有被篡改,将得到一个黑色的图像

四、提出的算法

图像
5.减去的图像由Imsub= abs(Im1-Im2)给出,并将Imsub转换为灰度格式。7.绘制直方图。

五、实验结果

下图展示了实验观察结果。图1显示了原始文本。嵌入算法后文本文档中的变化是难以察觉的,如图2所示。图3显示了被篡改的文档。后续图像显示了检测过程。图4绘制了在接收端获得的未篡改水印文本与再次运行算法获得的文本进行比较的直方图。图5说明了减去篡改水印文本的图像和在接收到的篡改文本上再次运行算法获得的文档后的输出。为图5生成的直方图如图6所示。从这些结果可以看出,如果文档被篡改过,那么在减法时观察到带有灰色斑块的黑色图像。否则,合成的图像将是完全黑色的。
图像
图1:原始原始文本
图1所示的原始文本在使用SHA-1算法(使用散列生成器)进行散列时会生成以下40- 16进制值:
“01 c12fc24deaa65e4452335485854481603cd4bd”
下表每个字母连同其相应的出现次数和振幅计算的基础上哈希函数。这些值然后被用作正弦函数的参数{Nn和An}来生成字母的瞬时颜色值,如第四节所述。表1给出了每个字母的总数和振幅。
图像
图3显示了被篡改的文档。后续图像显示了检测过程。
图像
图3:运行抽取算法后被篡改的文档
当文档未被篡改时,接收到的pdf和提取后生成的pdf是相同的。因此,减法得到的图像是完全黑色的。这导致直方图集中在0附近,如图4所示。
图像
图4:比较未篡改水印文档与再次运行算法获得的文本的直方图
篡改文件会导致正弦波参数的差异。因此,生成的图像具有灰色斑块,如图5所示。
图像
图5:将经过篡改的文字图像与图3中得到的图像进行减法
在绘制该减影图像的直方图时,可以观察到它不再集中在零沿线,而是分布在整个灰度上,如图6所示
图像
图6:图5的直方图

六、结论及未来工作

这里实现的算法是一种新颖的水印方案,它是不可察觉的,并保持了文档的真实性和完整性。使用字母计数作为变化参数,即使是微小的变化也具有前所未有的灵敏度,这是所提出的技术的优势。早期用于文本认证的水印技术在随机篡改攻击的情况下不可靠,特别是在篡改量较低的情况下。因此,该算法是通用的,高度不可察觉和脆弱的。未来的工作可能包括将算法扩展到彩色文档,并检测文档的格式变化,如缩进。只要稍加改动,该算法也可以扩展到其他语言。

参考文献

  1. J. Brassil, S. Low, N.Maxemchuk和L. O'Gorman,“在文档图像中隐藏信息”,第29届信息科学与系统年会论文集,约翰霍普金斯大学,第482-489页,1995年3月。
  2. J. T. Brassil, S. Low, N. F. Maxemchuk和L. O 'Gorman,“阻止文档复制的电子标记和识别技术”,IEEE通信选定领域杂志,第13卷,no. 1。8, pp 1495-1504。
  3. N. F. Maxemchuk, S. H. Low,“两种文本标记方法的性能比较”,IEEE通信选定领域杂志(JSAC)第16卷,no. 1。4, pp 561-572, 1998年5月。
  4. N. F. Maxemchuk,“电子文档分发”,AT&T技术期刊,第73-80页。1994年9月6日。
  5. 黄德,颜宏,“基于正弦波的文本图像水印的字间距离变化”,电子工程学报。视频技术电路与系统,Vol.11, No.12, pp.1237-1245, 2001年12月。
  6. M. J. Atallah, C. McDonough, S. Nirenburg和V. Raskin,“信息保证和安全的自然语言处理:概述和实现”,第九届ACM/SIG SAC新安全范式研讨会论文集,9月,爱尔兰科克,第51-65页,2000年。
  7. M. J. Atallah, V. Raskin, M. C. Crogan, C. F. Hempelmann, F. Kerschbaum, D. Mohamed和S.Naik,“自然语言水印:设计、分析和概念验证实现”,第四信息学报
  8. PA。Hasan M. Meral等,“文本水印的句法工具”,隐藏车间,卷LNCS 2137,第九届SPIE电子成像会议6505,匹兹堡,2004.25 -27 11:多媒体内容的安全性,隐写术和水印,圣何塞,2007年1月。
  9. M. Atallah, C. McDonough, S. Nirenburg和V. Raskin,“信息保证和安全的自然语言处理:概述和实现”,第九届ACM/SIGSAC新安全范式研讨会论文集,科克,爱尔兰,第51-65页,2000年9月。
  10. U. Topkara, M. Topkara, M. J. Atallah,“模糊的隐藏优点:通过同义词替换的自然语言文本的定量弹性水印”。ACM多媒体与安全会议论文集,日内瓦,2006。
  11. 孙星明,Alex Jessey Asiimwe,“基于名-动词的基于递归像样语义网络解析器的文本水印技术”,《计算机科学讲稿》(LNCS) 3612: 958-961,施普林格出版社,2005年8月。
  12. Topkara, M., Topraka, U., Atallah, M. j .,“通过错误隐藏信息:一种令人困惑的方法”,见:Delp III, E.J., Wong, P.W.(编著),多媒体内容的安全性,隐写术和水印电子成像SPIE6505。pp. 65050V-1-65050V-12, 2007。
  13. B. Macq和O. Vybornova,“一种使用预设的文本水印方法”,发表于2007年1月的SPIE多媒体内容安全、隐写术和水印国际会议论文集。
  14. 陆鹏等,“一种基于TMR的优化自然语言水印算法”,第九届国际青年计算机科学家会议论文集,2009。
  15. Wiyada Yawai和Nualsawat Hiransakolwong,“利用文本图像上的线相交来增加文本水印的隐藏位容量和强度”,IEEE ICCM, vol. 1, pp. 427-433, 2012。
  16. ZuneraJalil, Anwar M. Mirza, Hajira Jabeen,“基于字长零水印的文本篡改检测算法”,第2届国际计算机工程与技术会议,第6卷,pp. 378-382, 2010。
  17. Jalil Z., Farooq M., Zafar H., Sabir M.,和Ashraf E.“针对含义保留攻击的改进零文本水印算法”,世界科学工程与技术学院,第46卷,第592-596页,2010
  18. 魏宪民“基于正弦波的WORD文本水印算法”,计算机与信息应用国际会议,第10卷,pp. 99-102,2010。
  19. Zunera Jalil, Anwar M. Mirza, Maria Sabir,“基于内容的零水印算法的文本文档认证”,《国际计算机科学与信息安全》,第7卷,第1期。2,第212-217页,2010年2月。
全球科技峰会