ISSN在线(2320 - 9801)打印(2320 - 9798)
穆罕默德Alamgeer博士* 助理教授、部门的信息系统中,哈立德国王大学,沙特阿拉伯王国(KSA) |
相关文章Pubmed,谷歌学者 |
访问更多的相关文章国际期刊的创新在计算机和通信工程的研究
很难记得,只在1953年著名的DNA决定的双重螺旋结构。此后一系列惊人的发现。遗传密码的解开仅仅是个开始。学习的细节,像我们这样的基因在真核基因组及其不连续性质导致的能力研究和操作的材料,孟德尔的抽象概念,基因本身。学习阅读遗传物质越来越迅速使我们尝试解码的整个基因组
关键字 |
生物信息学、计算生物学、遗传学、分子生物学、GenSolution,炎症,PolyHydroxyAlkanoates,主题搜索,序列比较,最长公共子序列,启动子映射,限制映射,开放阅读框,解析器 |
一、概述 |
计算生物学是一个高度跨学科的生物学领域,依靠从计算机科学基本原理,生物,物理,化学,数学,统计。生物信息学,一个流行的词在这个大规模的DNA测序时代,只是计算生物学的一个子集——部分关心存储、组织、管理和生物数据的注释 |
计算生物学超出生物信息学领域的序列分析:发现基因和确定其功能;预测蛋白质和RNA序列的结构;和确定蛋白质和DNA序列的进化关系。计算方法,分子生物学数据库提取的基因组信息和交易发展的实现工具和算法来解决生物问题。通过保持所有这些类型的科学要求和计算生物学研究工作,自由访问的网站GenSolution设计从任何全球互联网门户网站“http://www.gensolution.org”。目前,工具和数据库设计和开发:主题搜索(主题发现接头连接,启动子映射),序列比较(得分矩阵,序列比对,最长公共子仪),限制映射(单消化,双消化)&开放阅读框仪GenCalculator(碱基对的决心,G + C百分比计算器,疏水性2 d-hp),数据库(炎症基因数据库,Polyhydroxyalkanoates)解析器(基因库解析器),和一些如核苷酸氨基酸翻译)。这也提供链接的其他门户网站相关生物信息学数据库、生物数据库和生物信息学工具和一些更有利于用户。一些算法为这些工具开发的NP完全和NP困难类型。 |
炎症基因和通路的数据库包括缩小发炎的所有基因微阵列实验的基础上分析和列出的路径映射短基因在现有代谢/监管途径 |
Polyhydroxyalkanoates旨在保持基因的数据库和相关的键值代表基因特征。这些基因负责合成可生物降解塑料。 |
在多个序列的最长公共子序列算法和子映射为ALgT (ECF sub-familyσ因子)是NP完全的类型。 |
GenSolution易于接近的所有应用程序在http://www.gensolution.org(现在合并在http://www.az-group.org)。所有评论,查询和建议应通过电子邮件发送(电子邮件保护)为此,网站主页上提供反馈和联系人链接。雷竞技网页版 |
二世。客观的 |
GenSolution的发展(网站通过生物信息学方法)涉及设计和创建工具解决生物问题与主题相关的发现,序列比较和统计的核苷酸和氨基酸序列的解决方案。数据库开发的存储中提取信息的基因Polyhydroxyalkanoates和炎症基因和通路的使用关系数据模型。此外,用户友好的web页面的设计将有助于通过网络技术在数据操作信息提取。重点是开发最长公共子序列问题的算法和赞助者映射ALgT (ECF sub-familyσ因子)是NP完全问题。网站提供轻松访问数据库并生成输出特定格式的欲望。 |
炎症基因和通路GenSolution数据库是一个数据库的炎症基因和通路负责炎症作用在人类,老鼠和老鼠。另一个数据库的网站是Polyhydroxyalkanoates持有的所有信息包括DNA和这些微生物基因的氨基酸序列,负责合成可生物降解的塑料。 |
GenSolution还提供链接的其他生物信息学资源有利于Bioinformatician一般链接各种可用的工具和数据库。GenSolution主页已经下降基于GUI菜单使网站容易访问。一些GenSolution免受未经授权的人的特点。访问这些类型的限制功能,作者提供了权利访问特定应用程序提供用户id和密码。 |
三世。GENSOLUTION——网站通过生物信息学的方法 |
的名为网站——GenSolution是通过生物信息学的方法。基本上它提供生物信息学工具来解决基本的生物学问题。这些工具,两个项目都是新的,是NP -完全问题,由作者和通过互联网公开访问。GenSolution网站提供两个大型数据库设计和开发标准化后的数据通过生物信息学技术。整个客户端/服务器模式的数据库提供了两个端编程中,一个用于用户访问,另一个用于数据库操作。 |
工具和数据库: |
3.1。主题搜索: |
我们在生物信息学最常见的一件事是寻找主题,短片段的DNA或蛋白质特别感兴趣。他们可能监管元素的DNA或短的蛋白质在许多物种中是守恒的。我们寻找的主题在生物序列通常不是一个特定的序列。 |
3.1.1。主题发现: |
它是一个工具,接受字符串和主题可能是监管的元素进入DNA或短链进入蛋白质字符串。选项-区分大小写和删除空间是大小写敏感的搜索和删除空格中输入字符串。 |
如果搜索主题出现在输入序列,那么它显示——多少次和位置(模式)的起始位置的主题存在,其他显示消息——主题没有找到。 |
3.1.2。接头连接: |
这个程序自动拼接连接识别。所有地方“GT”出现在字符串表示,接头连接发生的概率计算从前面的核苷酸。潜在的接头连接是为了大多数最不可能打印。 |
它接受核苷酸序列。提交一个序列后,显示所有职位序列拼接结(s)是()。它还显示相关的所有潜在的接头连接概率 |
3.1.3。子映射—AlgT (ECF子家庭σ的因素): |
铜绿假单胞菌是一种机会主义导致囊性纤维化患者慢性感染的病原体。频繁的院内感染是由这个病原体引起的。许多临床分离株特别是囊性纤维化患者表现出黏液状的表型。这是由于丰富的多糖藻朊酸盐的生产。对铜绿假单胞菌海藻酸是一种重要的毒力因素。相信它能抑制吞噬作用和潜在限制抗生素疗效由于有限的抗生素渗透。我们已经了解感兴趣的监管和生产海藻酸在铜绿假单胞菌。AlgT是σ因子的ECF亚科的成员。它已被证明控制表达式从18 kb为海藻酸生物合成的操纵子。ECF家族成员σ因子存在于形形色色的生物,他们应对各种形式的额外的细胞质的刺激。 Here I present a proteomic analysis to examine the regulon for AlgT. We have identified and demonstrated that dsbA is under transcriptional control of AlgT. I present here characterization of this gene and additional potential components of the AlgT regulon. |
它接受核苷酸序列在文本区域。如果发起人AlgT出现在输入序列则显示欲望的结果 |
3.2。序列比较: |
DNA的突变是一个自然进化过程:DNA复制错误导致替换、插入、核苷酸和删除,导致DNA的“编辑”文本。DNA序列之间的相似性可以共同进化起源的线索(如球蛋白基因在人类和黑猩猩之间的相似性)或线索常见函数(如v-sys致癌基因,这种激素)。 |
3.2.1之上。得分矩阵: |
得分矩阵用于每个alighnment nongap位置得分。核苷酸序列比对,一般身份,爆炸或过渡颠换评分矩阵。布拉斯特区——一个常用工具调整和搜索核苷酸序列是非常简单的矩阵分配一个+ 5分,如果两个核苷酸排列相同,否则和4。同样,单位矩阵分配1和0的比分分别同卵和异卵对齐的核苷酸。颠换的过渡矩阵提供了一个温和的奖励匹配的核苷酸,轻微的惩罚transions-substitutions嘌呤(或G)被替换为另一个嘌呤或嘧啶(C或T)取代了另一种嘧啶和颠换的更严重的惩罚,一个嘌呤被替换为一个嘧啶(C或T),反之亦然。 |
GenSolution提供得分矩阵程序接受两个核苷酸序列(身份、爆炸或过渡颠换矩阵)或氨基酸(PAM或BLOSUM矩阵)并生成一个矩阵类型的单位/爆炸/过渡颠换/ PAM / BLOSUM以二维形式最好的得分值。 |
3.2.2。两个序列比对: |
GenSolution提供本地和全局比对的两个序列的工具。基于局部比对工具还提供了爆炸和FASTA算法。这是一个程序,接受两个序列和用户需要选择类型的对齐(局部比对,爆炸——Ungapped局部比对,FASTA-Gapped局部比对,全局对齐)。在提交这些参数(值)产生预期的结果。 |
3.2.3。最长公共子序列: |
一个简单的动态规划算法来计算两个字符串之间的公共子序列由许多作者独立发现了。但是没有解决计算LCS在多个序列。 |
网站作者总GenSolution - LCS递归程序使用特定技术。在这种技术中,一旦序列的模式不匹配的时候任何序列,逃离这子序列,并选择下一个可能的子序列。 |
它接受序列列表(至少两个)在文本区域的特定格式。每个输入序列开始“>序列#”作为第一线和终止“/ /”符号是最后一行。在提交序列的列表,它生成最长公共子序列存在于所有输入的序列与指示的位置在每个序列。 |
最长公共子序列的结果页面程序还提供了链接生成ORF所有输入序列和蛋白质序列。 |
3.3。限制地图和子: |
3.3.1。限制地图: |
计算限制地图是一种常见的和实用的生物信息学计算在实验室。限制地图计划计算实验,找到最佳的方式来减少DNA插入基因,使突变的站点,或者几个重组DNA技术的其他应用程序。 |
3.3.1.1。单一的消化: |
在单消化,输入序列可以减少一个限制性内切酶。如果选择酶的限制网站(s)(是)在输入序列,然后削减限制网站的所有职位序列,切割后显示所有碎片。结果页面也显示了每个片段的确切位置获得后限制网站的行动。 |
3.3.1.2。双重消化: |
就像单一的消化,它接受核苷酸序列,但它提供了选择从下拉列表中选择两个不同的限制性内切酶。提交后,程序搜索限制酶的网站。如果网站给一个或两个酶,否则它将显示适当的结果显示消息。 |
3.3.2。开放阅读框(ORF): |
生物学家知道,因为一个DNA序列,必须检查所有六个阅读框的DNA发现细胞用来制造蛋白质编码区域。如果你不知道翻译数据,你必须考虑到六个可能的阅读框架。密码子是三个基地长期以来,翻译会发生在三个“帧”,例如第一基地开始,或第二个或者第三个。第四是一样从第一个开始。 |
因此经常检查所有六个阅读框的DNA序列,看看生成的蛋白质翻译长时间缺乏停止密码子的氨基酸。停止密码子DNA蛋白质翻译过程中明确的优惠。在翻译(实际上的RNA蛋白质),如果一个终止密码子,翻译停止,不再和肽链的增长越来越大。很长一段DNA,这段DNA不包含任何停止密码子被称为开放阅读框(orf)。 |
GenSolution提供工具让羊痘疮的输入序列。提交核酸序列后,它会显示所有可能的子出现在1到6(前3从原始序列和三个互补的序列)。如果不止一个开始停止地区被发现在任何阅读框,显示所有碎片结果页面 |
3.4。创计算器: |
3.4.1。碱基对的决心: |
它是一个程序,用来计算单个字符总数核苷酸或氨基酸在进入各自的序列。从用户接受的核苷酸序列或蛋白质和要求选择序列类型下拉选项。在提交这些参数值,用户将获得渴望的结果。 |
3.4.2。G + C计算器百分比: |
这是一个程序用来计算G + C含量进入核苷酸序列。它接受一个或多个核苷酸序列。如果用户输入多个序列,那么必须从每个序列符号“>”其次是序列名称作为第一行和最后一行符号“/ /”。在提交序列(s)将显示GC1 (G + C含量的第一个密码子的位置),GC2 (G + C含量第二密码子的位置),GC3 (G + C含量第三密码子的位置),和GCT(总G + C含量)计数为每个序列。 |
3.4.3。疏水性(2 d - HP): |
一个主要的简化,可以使蛋白质折叠的过程中只考虑疏水相互作用。采取了一步,假设所有的氨基酸都必须下降到等距的网格线的交点。进一步简化,只考虑一个二维网格,因为它很容易画网格对于这样一个例子。 |
GenSolution的工具读取一个输入序列的氨基酸组成的分类和方向得到t下氨基酸的位置。 |
3.5。数据库: |
3.5.1。炎症基因和通路数据库: |
炎症基因和通路的数据库包括缩小发炎的所有基因微阵列实验的基础上分析和列出的路径映射短基因在现有代谢/监管途径。这是一个超集炎症通路和基因数据库。整个列表的基因从基因组整体缩小了人类,老鼠和老鼠的基础上微阵列实验结果和基因的描述。两个全球数据库(KEGG & Biocarta)路径的集合。NCBI数据库资源有助于收集所有信息的基因。从数据库获取查询结果,三个主要的独立模块(单基因查询搜索、查询搜索多基因和通路模型搜索)设计是有用的分析微阵列数据和基因参与炎症通路。 |
所有通路的基因集合,聚集在相似性的基础上的生物和化学性质(从全球下载数据库)。超链接,每个基因通路。在点击这个基因,基因相同的用户可以知道细节。每个查询搜索的结果页面包含超链接的全球数据库(NCBI, Biocarta和KEGG),通过点击该用户可以跳上这对合成基因数据库,最后将目前更新的结果。所有模块结构设计的时间和最终系统测试是功能测试。 |
3.5.2。Polyhydroxyalkanoates数据库: |
开发这样一个数据库的目的是建立的数据库列表的生物和基因及其相关基因的物理和化学性质,能够合成可生物降解的塑料。这个数据库变得有利于科学家们正在研究这种生物降解塑料合成项目。 |
Polyhydroxyalkanoates数据库是一个单一的基因和基因组信息存储库负责Polyhydroxyalkanoates合成可生物降解塑料。它是基于基因组特征的中间体Polyhydroxyalkanoates(出租车基因,负责生物可降解塑料合成)代谢途径。从数据库获取查询结果,两个主要的独立模块设计有用的基因分析出租车的有机体。 |
访问数据库,网页设计这是有益的,用户友好的和完全验证提供容易查询搜索数据库。 |
这个主页Polyhydroxyalkanoates数据库提供设施查询搜索通过输入搜索关键生物的名称或通过点击字母列表生物/分类单元。 |
3.6。解析器: |
解析器是一种程序或技术,通过它我们可以提取或从冗长的平面文件解析不同的注释或特定的信息序列。不同的生物信息学现有数据库生成特定格式的结果和用户需要从海量的线提取所需信息。常见的生物信息学数据库文件格式是基因库,PDB和爆炸我们需要解析注解和序列。 |
3.6.1。基因库解析器: |
基因库扁锉(GBFF)是基因库中的信息数据库的基本单位。它是最常用的格式表示的生物序列。GBFF分为三个部分:标题,其中包含的信息适用于整个记录;注释的功能,记录;和核苷酸序列本身。 |
GenSolution——基因库解析器提供了一个工具,促使基因库扁锉基因库数据库提交后显示所有用户注释和检查参数值。我们可以过滤轨迹,定义,加入,版本,来源,生物,从消息头部分和引用;整个功能或源细节,基因,cDNA、。酸序列形式特征表;和起源(核苷酸序列)。 |
解析注解和序列从基因库扁锉使用正则表达式的概念。修饰符的模式出现在扁锉有助于解决这种类型的解析器。 |
四、验证 |
每个程序在GenSolution验证接受输入的查询指定格式。大多数的项目为终端用户提供链接有助于正确地访问工具和数据库。它提供了确认,通过提供客观证据,要求一个特定的预期用途或应用程序已经实现了。 |
调用任何事件的行动之前,代码的程序(模块)首先检查条件,如果满足,否则执行命令的操作给用户消息。在整个项目开发中,大部分的验证已经使用在客户端程序中(通过使用JavaScript)和一些服务器端程序来验证数据在数据库服务器(通过使用ASP)。除了一些,大多数事件的行动完全验证,提供工具和质量更好的组织架构模型。 |
诉安全 |
在这个GenSolution,利用MS SQL数据库开发。为了保护这种类型的数据库,需要更多的保护能力。GenSolution限制从未经授权的访问的一些特性。访问这些类型的特性,作者提供用户ID和密码。 |
VI。优势 |
——GenSolution提供多个解决方案在单一平台与单一的个人主页地址。整个开发工作是通过生物信息学方法(通过它的生物问题的解决方案)。 |
- LCS多个序列和启动子映射AlgT金色的解决方案由作者是NP完全问题。 |
——主题搜索、序列比对、基因库解析器,顺序翻译,ORF仪,限制地图等工具来解决许多问题上升在数据分析研究 |
——文档和缩写让更容易访问。链接为许多生物信息学网站使它流行的研究人员和学生 |
——接头连接,疏水性,G + C含量和碱基对计数器GenSolution工具有助于生物核苷酸序列的统计计算。 |
——GenSolution有两个数据库,用于研发制药和环境基因组学研究组织 |
——尽管算法的复杂性,快速执行。 |
——建立接口,整个ASP程序和模块是基于DSN-less模式。这样的模型提供了整个网站模型的鲁棒性。 |
——作者接受来自用户的反馈,欢迎建议任何错误,不正确,为进一步改进。 |
七世。的未来GENSOLUTION |
在未来几天,作者计划做这个网站面向的研究将有助于生物,Pharmaceuticians,化学家和Bioinformatician信息技术通过生物信息学的方法。 |
——GenSolution作者计划开发一些biostatistical的计算工具,如原子密度、密码子适应指数(CAI)值,卡乡绅检验等。 |
——作者也开发一个大型数据库的药用植物的基因。 |
——作者还试图开发工具多序列比对。 |
——在未来的时间,作者将尝试开发货郎担问题算法基于人工神经网络(NP完成) |
——用户将获得更多的有用链接GenSolution主页,这将有助于对生物信息学工作。 |
八世。可用性 |
所有可用的工具和数据库在GenSolution自由访问http://www.gensolution.org或http://www.az-group.org/GenSolution/home.asp或GenSolution链接可以在http://az-group.org主页。所有的评论,应该通过电子邮件发送查询和修正(电子邮件保护)为此,网站主页上提供反馈和联系人链接。雷竞技网页版 |
第九。结论 |
网站“GenSolution…通过生物信息学的方法”来概述作者的研究开发,并提供相关资源的链接和其他信息基因组学,生物技术和生物信息学。整个研究工作是封装的名义GenSolution -序列分析和主题发现;序列翻译和子仪;对齐;基因库解析器;碱基对,G + C含量和Hydrophobocity计算器;LCS算法和赞助者的映射ALgT (ECF子家庭σ因子);炎症基因和通路和Polyhydroxyalkanoates数据库等。 |
工具——主题仪,拼接结仪,启动子mapper AlgT是基于模式匹配和有利于各自的基因组分析方面。相关序列压缩——得分矩阵,序列比对,lcs仪有利于压缩的核苷酸序列。限制映射程序(子映射的单引号和双消化)有助于减少核苷酸序列与不同的限制性内切酶片段序列在实验室干。通过开放阅读框的用户可以得到所有可能的输入帧基因。gencalculator GenSolution提供工具碱基对计数,g + c含量计数器,核苷酸序列的疏水性等执行不同的统计操作在核苷酸和氨基酸。基因库解析器有助于解析不同注释的基因银行扁锉。有一个工具核苷酸序列翻译成氨基酸序列。 |
炎症基因和通路的数据库包括缩小发炎的所有基因微阵列实验的基础上分析和列出的路径映射短基因在现有代谢/监管途径。这是一个超集炎症通路和基因数据库。整个列表的基因从基因组整体缩小了人类,老鼠和老鼠的基础上微阵列实验结果和基因的描述。两个全球数据库(KEGG & Biocarta)路径的集合。NCBI数据库资源有助于收集所有信息的基因。从数据库获取查询结果,三个主要的独立模块设计是有用的分析微阵列数据和基因参与炎症通路。 |
Polyhydroxyalkanoates旨在保持基因的数据库负责Polyhydroxyalkanoates合成可生物降解塑料。它是基于基因组特征的中间体polyhydroxyalkanoates(出租车基因,负责生物可降解塑料合成)代谢途径。从数据库获取查询结果,两个主要的独立模块设计有用的基因分析出租车的有机体。 |
在GenSolution收集有关的各种网络资源也在一个网站。生物数据库GenSolution网站提供的链接和生物信息学工具有助于Bioinformatician和生物信息学的学生。搜索工具的所有程序和数据库操作完整的验证。尽管复杂的算法,执行速度快。 |
x确认 |
作者感谢Moinuddin汗博士,博士Abdul Ilah博士,华盛顿特区教授Upadhaya s i Ahson赛义德先生Zeeshan Hussain Kamal艾博士讨论和鼓励。作者还感谢辛格Kulvinder赛博士和vc氧化钾给我机会认识到这种类型的生物问题研究培训期间分别Ranbaxy和IGIB研究中心。作者深深地感谢可敬的先生。Singhania(总理Singhania大学)和拉库马先生Yadav Singhania主席(大学),给我工作的机会,利用大学校园的生物信息学中心的设施。作者也感谢父母、家庭成员、亲戚、村民和朋友的支持、自由和动力。 |
引用 |
|