所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

图像隐藏在DNA序列使用算术编码

萨米尔·库马尔教授Bandyopadhyay1 *和Suman Chakraborty先生
  1. 大学计算机系Sc。& Engg加尔各答A.P.C.路92号,印度加尔各答- 700009
  2. 安塞波达尔学院管理137年技术,vip路,印度加尔各答- 700052
通讯作者:萨米尔Kumar Bandyopadhyay教授电子邮件:skb1@vsnl.com
相关文章Pubmed,谷歌学者

访问更多的相关文章全球研究计算机科学杂志》上

文摘

最近,生物技术越来越受欢迎,因为它们是应用于许多类型的应用程序,认证协议,生物化学和加密。最有趣的生物学技术之一是deoxyribo核酸和使用这些域。隐藏秘密deoxyribo核酸数据成为一个重要和有趣的研究课题。一些研究人员在转录deoxyribo核酸隐藏的秘密数据,转换日博核酸区域,或者主动编码部分没有提到修改原始序列,但其他人隐藏数据non-transcribed deoxyribo核酸,款非翻译作品日博核酸区域,或活跃的代码段。不幸的是,这些计划改变功能或修改原deoxyribo核酸序列。DNA有能力存储大量的数字数据。本文提出一种方法来隐藏一个图像在DNA序列使用算术编码。

关键字

信使rna, DNA算术编码和解码

介绍

今天,网络技术已经进步了很多,越来越多的人访问远程设施和发送或接收各种各样的数字数据在互联网上。然而,互联网是一个公共但不安全信道来传输数据。因此,重要信息必须被隐藏而通过互联网,仅授权接收方可以得到它。有两种主要的方法隐藏秘密信息传统的加密和隐写术。
DNA中的信息存储为代码由四个化学基地:腺嘌呤(a)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)人类DNA由大约30亿个碱基,和超过99%的基地在所有的人都是一样的。的订单,或序列,这些基地决定了信息用于建立和维护一个有机体,类似的字母的方式出现在一定的顺序形成单词和句子。
DNA碱基配对,和T C与G,形成单位称为碱基对。每个基本还连着一个糖分子和一个磷酸分子。在一起,一个基地,糖和磷酸被称为一个核苷酸。核苷酸排列在两个长链,形成一个螺旋称为双螺旋结构。双螺旋结构的有点像梯子,形成碱基对梯子的横档和糖和磷酸分子形成的垂直侧部梯子[1 - 4]。
DNA的一个重要属性是它可以复制,或复制本身。双螺旋结构中的每个DNA链可以作为模式复制序列的基地。这是至关重要的细胞分裂,因为每一个新的细胞需要的精确复制DNA存在于旧的细胞。这是图1所示。
图像
信使rna与DNA转录,蛋白质合成的携带信息。连续三核苷酸在信使rna编码氨基酸或蛋白质合成的停止信号。三核苷酸被称为密码子。这是图2所示。2。
图像
信使核糖核酸的序列互补的DNA模板链,因此DNA编码链一样,除了T被U。
图像

算法1:图像嵌入技术在mRNA

步骤1:选择一个任意的信使rna序列图像的二进制序列。
步骤2:将信使rna序列转换成氨基酸序列。

算术编码

在算术编码,一个消息是由实数在0和1之间的时间间隔。随着消息变得更长,所需的时间间隔”来表示它变得越来越小,指定区间生长所需的比特数。消息的连续符号减少间隔的大小按照生成的符号概率模型。符号越有可能减少的范围小于不符号,因此更少的部分添加到消息[5 - 6]。
在任何传播之前,消息的范围是整个区间[0 l)表示半开区间0 5 x < 1。每个符号处理,范围是缩小到这部分分配给的象征。
例如,如果我们要对随机编码消息“比尔盖茨”,我们会有一个这样的概率分布:
图像
一旦字符概率是已知的,个人符号需要分配一个沿着概率范围线,名义上是0到1。不管哪个角色分配的范围,只要是在同样的方式通过编码器和译码器。九个字符符号集使用这里看起来像这样:
图像
每个字符的一部分分配范围0 - 1对应于其出现的概率。还要注意字符“拥有”的一切,但不包括更高的数字。所以字母“T”事实上范围0.90 - 0.9999…。
算术编码信息的最重要的部分属于第一个符号编码。当编码消息“比尔盖茨”,第一个符号是“B”。为了第一个字符是正确解码,最后编码信息必须是一个数量大于或等于0.20,小于0.30。我们做编码这个数字跟踪范围,这个数字可能下降。所以第一个字符编码后,这个范围是0.20的低端和高端的范围是0.30。
第一个字符编码后,我们知道我们的范围输出数量现在是有界的低数量和高数。其余的编码过程中发生了什么是,每一个新的符号编码将进一步限制输出数量的可能范围。下一个字符编码,‘我’,拥有0.50到0.60范围。如果是第一个数字在我们的消息,我们将直接将这些值高低范围值。但“我”是第二个字符。所以我们做的是说“我”拥有的范围对应的新子范围0.50 - -0.60 0.2 - 0.3。这意味着新的编码号码必须介于50到60百分位当前建立的范围。应用这种逻辑将进一步限制我们的号码0.25到0.26范围。
图像
图像
只有二十种不同的氨基酸,从mRNA密码子编码。这清楚地表明,一些密码子可能映射到同一个氨基酸。例如,密码子GCU部件,GCC, GCA和GCA的映射到相同的氨基酸列伊。由于这种重复我们可以得到不同的信使rna序列相同的氨基酸序列。算术编码是用于生成不同的信使rna,将图像转换成十进制数。

算术编码

图像
从这种方法得到了不同的信使rna序列相同的氨基酸序列。顺序是“中联科利CCA UGC广汽GUC GCU部件GGA AUU UUC GGC CAG UGG UAC AUC的煤炭UGU”。它将产生相同的图像。

结论

今天,网络技术已经进步了很多,越来越多的人访问远程设施和发送或接收各种各样的数字数据在互联网上。然而,互联网是一个公共但不安全信道来传输数据。因此,重要信息必须被隐藏而通过互联网,仅授权接收方可以得到它。有两种主要的方法隐藏秘密信息传统的加密和隐写术。
DNA有许多特点,使它成为一个完美的隐媒体。这些技术依赖于DNA的高随机性隐藏任何消息没有被注意到。本文提出一种方法来隐藏一个图像在DNA序列使用算术编码。

引用

  1. 彼得森P。,“Hiding in DNA,” in Proceedings of Muse, pp. 22, 2001.
  2. Rijmen P。,“Advanced Encryption Standard,” in Proceedings of Federal Information Processing Standards Publications, National Institute of Standards and Technology, pp. 19-22, 2001.
  3. 里维斯特L。,Shamir A., and Adleman L., “A Method for Obtaining Digital Signature and Public Key Cryptosystem,” Computer Journal of Communications of the ACM, vol. 21, no. 2, pp. 120-126, 1978.
  4. 代表赛义卜·M。,El-abd E., and El-Zanaty M., “On Covert Data Communication Channels Employing DNA Recombinant and Mutagenes is based Steganographic Techniques,” Computer Journal of Bio Systems, vol. 57, no. 2, pp. 13-22, 2000
  5. Shimanovsky B。,冯J。,and Potkonjak M., Hiding Data in DNA, Springer, UK, 2003.
  6. 萧述三e和艾奥瓦州的M。,“Data Encryption Standard,” in Proceedings of Federal Information Processing Standards Publications, National Institute of Standards and Technology, pp. 550-559, 1988