所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

基于云计算的高性能计算:一个埃塞俄比亚大学的框架

撒母耳Fentahuen1,Sreenivas Velagapudi2
  1. 硕士学生,部门计算阿达玛科技大学,阿达玛,埃塞俄比亚。
  2. 学系助理教授计算阿达玛科技大学,阿达玛,埃塞俄比亚。
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

云计算正成为一个可采用的技术的许多组织的动态可扩展性和使用虚拟化资源作为服务通过互联网。它与应用程序快速增长几乎在任何领域,包括学术界。[1]云计算模式启用方便,——需求和网络访问共享的可配置的计算资源池,(网络、服务器、存储、应用程序和服务),可以快速予以配置和发布以最小的管理工作或服务提供者交互。高性能计算(HPC)使科学家和研究人员能够解决复杂的问题,需要很多计算能力。在学术界和产业界集群计算已经成为流行。集群的服务器用于各种分布式应用程序模拟、数据分析、web服务等等。因此,需要研究的领域之一是处理大型数据集的云。La rge数据集是HPC应用程序的重要特征之一。在本文中,我们将讨论私有云基础设施使用OpenStack通过考虑HPC的实现为每个大学。然后,创建一个协作机制为每个大学全国私有云使用联邦云架构。

关键字

云计算、高性能计算、教育云联邦云计算

介绍

处理和存储技术的快速发展和互联网的成功,计算资源变得更便宜,比以往任何时候都更强大和更普及。这种技术趋势使得一个叫做云计算的新计算模型的实现,在哪些资源(如CPU和存储)作为通用实用工具,可以提供租赁和发布的用户通过互联网以按需方式。现在一天政府、学术机构、研究中心,不同的政府和非政府机构现在采用云计算解决方案相关问题和需求不断增加,例如许多学术机构都倾向于使用谷歌的电子邮件应用程序作为解决方案的企业电子邮件系统,现在一天的每一个人另一个例子是将文件存储在云存储像Google Drive, Dropbox, SurDoc等。因此,在一个方面或另一个我们现在使用云服务。目前,云提供服务以外的公共云服务像SaaS, PaaS和IaaS用于高性能计算基础设施。云计算提供了一个独特的机会为批处理和分析工作,分析tb的数据,可以花费几个小时的时间来完成。
云技术,如谷歌MapReduce, Google文件系统(GFS), Hadoop和Hadoop分布式文件系统(HDFS),微软森林女神,CGL-MapReduce并行运行时数据采用一种更中心的方法[2][3]。在这些框架,数据在数据/计算节点的集群或大规模的数据中心。本文的主要目标是创建一个框架为埃塞俄比亚大学HPC云基础设施。本文的动机工作放在以太网[4]项目,该项目旨在构建和交付高度互联、高性能网络大学和其他教育和研究机构在埃塞俄比亚。更具体地说,以太网的目的是建立和提供高性能网络相互连接这些机构和类似的机构,并且通过这样做使他们能够共享教育资源,在埃塞俄比亚和全球合作
本文的组织结构如下,第一部分将讨论云计算,其服务和部署类型,第二部分将讨论在HPC和相关技术,第三部分将讨论在云联盟,第四部分提出了相关工作,最后我们将提出云使HPC基础设施框架埃塞俄比亚大学最后的结论和未来的工作。

相关工作

计算智能研究集团(CIRG)在比勒陀利亚大学,南非[5],他们做研究CI算法,但学生面临挑战,他们试图解决的问题也是不容忽视的。这意味着CI算法的搜索空间可以变得非常大,导致非常需要大量的计算工作负载。达到统计学意义的结果,每个学生工作负载需要包含成千上万的实验使用不同的参数,输入,问题类型等,每个学生的工作负载可能会以天或数周,为一些额外的情况下需要甚至几个月来计算在一个工作站上运行24小时7天。学生CIRG试图解决他们面临的挑战,同时在多个工作站上运行他们的实验。这提供了一些改进吞吐量、可伸缩性和故障转移,但有许多问题的调度和管理。
最后他们自动化他们的问题与云计算,云计算描述一个平台和一个类型的应用程序。一个云计算平台动态规定,配置,reconfi gur和取消供应服务器。云中的服务器可以是物理服务器或虚拟机。云是一个虚拟化的计算机资源池,可以:
•举办各种不同的工作负载,包括batch-style -后端工作和互动,面向用户的应用程序
•允许部署和工作负载具有伸缩性快速通过的快速配置虚拟或物理机器
•支持冗余,self-recovering,高度可伸缩的编程模型允许工作负载从许多不可避免的硬件/软件故障中恢复
一个¯€实时监控资源使用,使平衡分配
对于这些研究云计算可以简化管理,很容易计算资源的调度和预订。另一种技术使用自动化他们的研究是创建网格应用程序与Apache Hadoop[6],它是一个开源框架,运行在大型集群的硬件并行计算应用程序。Apache Hadoop是基于MapReduce算法。MapReduce[7]是一种编程模型,该模型允许将一个大任务分解(或映射)分解成多个小任务,可以作为单独的处理工作。reduce函数结合了所有的输出较小的工作以指定的方式提供原始大任务的输出。Apache Hadoop框架负责作业管理等方面的工作运行跟踪节点,工作成功完成,哪些工作需要重启失败,和其他任务。
Hadoop工作在分布式集群上运行,数据管理是至关重要的。Apache Hadoop使用Hadoop分布式文件系统(HDFS)来创建多个副本的数据项在不同的集群中的节点。使用这个应用程序,数据可靠性是通过增加冗余。数据还保持着密切计算资源,使用它,从而提高性能。
MapReduce算法和HDFS的结合使并行网格应用程序开发和部署快速、轻松地,以最少的开发时间花费在网格管理方面。使用IBM cloud和Hadoop, CIRG比勒陀利亚大学的学生意识到许多好处:
•研究计算时间从周减少到天
•解决方案提供了一个平台,让学生迅速部署网格应用程序
•一个新的机制,研究小组使用开放的意念
•能够轻松地管理和快速部署新基础设施的能力。
[6]更经济的解决方案获得必要的计算资源是云计算。一个常见的模式是有大量数据需要转换,每个数据项的处理基本上是独立于其他数据项;也就是说,使用一个单指令多数据(SIMD)算法。Hadoop核心为云计算提供了一个开源框架,以及一个分布式文件系统。
在[8]HPC云是云的延续和一个关键的区别主要哲学。随着虚拟化并不适合所有工作负载,HPC云必须同时支持虚拟化和直接访问计算资源。这允许将工作负载可以虚拟化扩展需求而不干扰其他物理主机。虚拟化使HPC之前没有灵活性。随着计算机节点的处理核心密度增加一个操作系统开始更少的意义。与虚拟化单个节点可以同时运行多个操作系统,允许多个用户使用相同的资源。这允许HPC基础设施利用率更高的用户在其组织和它的持续投资。虚拟化的另一个关键好处解耦用户的工作从物理资源运行它。主要有两个含义的高性能计算(HPC)的机器利用率水平大学[9]。首先,高校需要HPC机器——这主要是为了解决/计算要求的问题。 Second, it is very hard to accommodate the hardware resources for HPC. An example of universities using HPC is a VCL.

提出了框架

拟议的框架由一个私有云基础设施和HPC的基础设施,我们使用OpenStack[10]开源云操作系统部署云基础设施和我们使用Hadoop作为HPC集群[6]。这种技术本身;然而,当它们连接在一起,大学经历的好处是巨大的。尽管环境复杂,一个企业将看到巨大的协同效应,加入OpenStack私有云与Apache Hadoop环境。

迅速、新星、APACHE HADOOP MAPREDUCE

下一小节将介绍如何组织可以将这个提议框架集成到私有云及高性能计算技术。HPC的常见的部署模型部署私有云环境开放堆栈的迅速加入到Apache Hadoop MapReduce集群存储技术进行处理。使用此体系结构的优点是,每个大学都有一个可伸缩的存储/计算节点。
我们可以使用先进水平的灵活性、可伸缩性、和自治在高性能计算环境中,大学可以利用母语能力的Apache和OpenStack提供的开源产品。完全可伸缩的和灵活的高性能计算环境,它必须运行在一个私有云环境提供了存储和计算节点。要做到这一点,宇宙必须首先构建私有云,然后添加高性能计算。所以,在这一点上,迅速、新星和RabbitMQ当然是需要以及控制器节点管理和维护环境。
为了integerate这个技术是基于OpenStack私有云基础设施和Hadoop光泽我们使用一种特殊的API叫Savana控制器,该控制器允许一样给HPC云用户的服务。图4中,展示了草原Hadoop API集成基础设施和OpenStack的基础设施。
•Horizon-Provides GUI能够使用草原的所有特性。
•Keystone-Authenticates用户和提供了一个安全令牌,用于与OpenStack的其余部分,因此限制了用户的能力在他或她的稀树大草原OpenStack的特权。
•Nova-used提供vm Hadoop集群。
•Glance-Stores Hadoop VM映像都包含一个安装操作系统和Hadoop。
•斯威夫特博士作为数据的存储,将由Hadoop处理工作。

结论和未来的工作

高性能计算和云计算的未来是光明的,随着不同的intercloud API,高性能计算技术。这个机会将回答许多问题在学术界和研究中心关于调控资源配置访问和高性能集群计算基础设施。在本文中,我们已经讨论了当前最先进的高性能计算潜在的机会和学术界的私有云。采用云计算技术和模式计算的新时代占据集群计算节点的本地和/或远程云和无疑在学术界和研究中心成为流行和有吸引力。终端用户,学生中也广为传播,研究人员,可以帮助他们举办数据到云上。关心的科学计算,这一趋势仍处于初级阶段。我们还讨论联合云基础设施,使高校私有云分享和协作通过高性能MoE纤维网络骨干。
这个拟议的框架后联合私有云部署模型,使HPC,有问题相关成本、性能和其他参数,我们不专注。云计算拥有很多承诺强调HPC应用程序。PaaS和IaaS最有可能更适合举办惠普C应用程序在云中。作者建议作为未来工作措施性能问题,成本、网络延迟等参数与不同的部署模型,和高性能计算。一件事提出这个模型部署为一个大学的真正优势集群计算(HPC)和云计算。

数据乍一看

图1 图2 图3 图4
图1 图2 图3 图4

引用