所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

磁盘驱动器性能的统计分析与应用程序直接预取方法

Javed侯赛因1伊卜拉欣-汗2
  1. Mewar大学研究学者Chittorgarh,拉贾斯坦邦,印度
  2. Vidyapeeth研究所的科技、博、中央邦、印度
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

现代磁性磁盘,众所周知,大大慢比顺序读取随机读取。技术进步加剧了问题;磁盘吞吐量增长了60到85倍在过去的25年,但寻道时间下降了15倍。磁盘是越来越不像随机存取设备的性能代价。虽然flash内存减少的成本差随机访问,磁盘继续提供大量廉价的存储。在可预见的未来,仍将是重要优化性能的应用程序访问磁盘等设备,设备更快比随机存取顺序。这个性能问题的最佳解决方案是完全避免关键路径磁盘访问和阅读顺序存取和丢弃不需要的数据。

关键字

加密、Libprefetch寻求、预读、StridedAccess Sqlite。

介绍

在application-directed预取系统中,应用程序通知其预期即将到来的读取的存储系统。(数据库、科学工作负载和其他人很容易能够计算未来的访问。以前的工作在application-directed缓存和预取了相对较低的单个进程的加速效果,单盘的工作负载(平均加速26%,最高49%)。然而,这项工作旨在重叠CPU和I / O取回时间没有大大增加内存使用,因此预取的相对较少的数据从磁盘(16块)前一个过程需要它。我们的系统,目的仅仅是为了减少I / O获取时间,一个更好的选择考虑到今天的处理器和磁盘性能之间的差距扩大。预取系统咄咄逼人,获取尽可能多的数据符合可用内存。它也相对简单,拟合与现有的操作系统技术;大多数代码是在一个用户空间库。变化很小,但关键,内核行为帮助确保保存直到它使用预取数据。争用控制器检测到的变化可用内存和预取窗口大小来补偿,避免性能崩溃预取应用程序时争夺内存时的性能和增加更多的内存可用。 Our measurements show substantial speedups on test workloads, such as a 20x speedup on a SQLite table scan of a data set that is twice the size of memory. Running concurrent instances of applications with libprefetch shows similar factors of improvement.

二世。相关工作

由于墨西哥湾long-growing性能之间的磁盘和CPU速度,已经投资了相当可观的研究成果提高磁盘读取性能的缓存和预取。预取工作特别是基于预测,application-directed,推断磁盘访问模式
磁盘建模Ruemmler和威尔克斯是磁盘上的经典论文性能建模。我们的寻道时间观察补充那些Schlosser等;像他们一样,我们用我们的观察来构建更有效的方式使用磁盘。
预测访问操作系统一直采用预测预读算法加快顺序文件访问。这对许多工作负载提高了性能,但如果未来的访问都是预测可以延迟性能。因此,预读算法通常不要试图改善难以预测的访问模式,如许多小的顺序读取文件或非时序的读取大型文件。
Application-Directed访问曹等人,帕特森等系统libprefetch这样应用程序来表达他们的文件访问模式制度增加磁盘读取性能。
图像
推断访问而不需要应用程序显式地提供一个未来的阅读列表,预取系统可以自动生成列表从应用程序源代码,使用静态分析[1],或从正在运行的应用程序,使用投机执行[3]。

三世。现代磁盘特征预取的影响

磁盘预取算法的目标是提高未来的磁盘读取的性能通过读取数据之前是必要的。因为我们的预取算法将使用精确的应用未来的访问信息,我们不需要担心检测访问模式或试图预测接下来会使用应用程序。相反,主要目标是确定最快的方法从磁盘检索请求的数据。
本节将使用磁盘基准系统建立的预取算法,利用优势,尽可能地避免了弱点,现代的I / O子系统。预取算法必须至少读块所需的应用程序,所以只有少数的自由度。prefetcher可以重新排序磁盘请求窗口内的可用内存缓冲,它能把磁盘请求,它可以读取非必需数据如果会有所帮助。不同的磁盘布局或块分配算法也可能导致更好的性能,但这些文件系统设计技术是正交的,我们考虑的问题。

寻找性能

传统的磁盘调度算法不知道额外的请求将抵达未来,导致一个相对较小的缓冲区的请求,可以重新排序。相比之下,一个预取算法,知道未来的访问可以使用一个重新排序缓冲区可用内存一样大。一个更大的缓冲可以大大减少平均距离。在本节中,我们测量各种寻找距离现代磁盘上的实际成本,旨在确定寻找距离问题和是多少。我们测量的平均时间寻求各种距离,向前和向后。因为下面的寻求操作磁盘接口抽象,它只是可以衡量一个寻求与一个读或写操作。因此,基准开始通过阅读的第一块磁盘建立磁盘头位置(或最后一个块,如果寻求向后),然后从磁盘读几个街区,每个分开的距离被测试。使用这种测试方法,寻求距离为0意味着我们与多个请求顺序磁盘读取的位置,和寻找距离1块反复重新读取同一个街区。所有的测试在这一节中使用直接I / O跳过缓冲区缓存,确保缓冲区缓存命中率不优化掉影响我们试图衡量寻道时间增加了大约5倍从112 kb大约4 mb,显示为图表。相比之下,寻道时间的距离超过2.7 mb增加缓慢,约一倍。Not considering the disk geometry effects visible as oscillations, a disk scheduling algorithm should minimize seek distance; though not all seek reductions are equal, reducing medium seeks far below 2MB will have more impact than reducing very large seeks to 2MB or more. Figure 1 shows the unexpected result that for distances up to 2.7MB, it may be cheaper to read that amount of data than to seek. This suggests that adjacent requests with small gaps might be serviced faster by requesting the entire range of data and discarding the uninteresting data.

四、结果

图2表明,阅读和丢弃小差距请求可能比寻求在这些空白。我们修改了之前的基准添加填充物,不同最大允许加密。图显示,在填充32 kb的减少运行时在磁盘上2。这对应于图1的地区寻求需要更长的时间比体积的最大吞吐量。加密32 kb和2 mb之间没有额外的效果,对应于该地区寻找图的寻道时间等于读取时间等量的数据。当加密允许超过2 mb,运行时增加。Itconfirming读取这个尺寸的是比寻求价格更贵。为16 mb的重新排序缓冲区数据集,加密很少效应:如图2所示,这个测试的平均寻求距离是128 kb,高于阈值,我们希望加密的帮助。然而,在磁盘上1 performanceneutral加密。显然它的固件使加密主要是多余的。
图像

诉的结论

现代磁盘的性能特征的分析我们引领到一个新的预取方法。我们的预取算法的数量降至最低,昂贵的寻求和导致大量不连续的工作负载的性能提高。Libprefetch,一个相对简单的库,实现了该技术,可以加快不连续的磁盘访问的真实世界的实例,包括图像处理和数据库表扫描,高达4.9 x和20个,分别为工作负载不适合在主存。此外,一个简单的争用控制器使这个新的预取算法和平共存与它以及其他应用程序的多个实例。现代磁盘的性能特征的分析让我们填入的新方法。我们的加密算法减少寻道时间的大量昂贵的寻求和导致非时序的工作负载的性能提高。虽然它需要平均3 MB的专用内存操作但提供1.049 x - 1.084 x改善寻道时间。

引用

  1. 克里斯Ruemmler和约翰·威尔克斯,”介绍了磁盘驱动器建模。”,IEEE计算机27 (3):17-28,1994。
  2. http://fox.wikis.com/wc.dll?Wiki ~现代硬盘规格。
  3. 托马斯·M。,Kroeger and Darrell D. E. Long, “The case for efficient file access pattern modeling.” In Proc. 7th Workshop on Hot Topics in Operating Systems (HotOS-VII), pages 14-19, Rio Rico, AZ.
  4. 史蒂文·W。,Schlosser, Jiri Schindler, Stratos Papadomanolakis, Minglong Shao, Anastassia, Ailamaki, Christos, Faloutsos, and Gregory, R.Ganger, “On multidimensional data and modern disks. “, In Proc. 4th USENIX Conference on File and Storage Technologies (FAST '05), pages 225-238, San Francisco, CA, December.
  5. 詹姆斯Griffioenand兰迪·阿普尔顿,“减少文件系统延迟使用预测方法”,在Proc。USENIX 1994年夏季技术会议,页197 - 207,波士顿,MA。
  6. 丹陶醉,迪伦麦克纳米大卫·斯逖尔和乔纳森·沃波尔“与设备无关的文件I / O的自适应预取”,http://proceedings.spiedigitallibrary.org/ 12/19/2013使用条款:http://spiedl.org/terms。
  7. Seung吴的儿子SaiPrashanthMuralidhara OzcanOzturk MahmutKandemir,易卜拉欣Kolcu Mustafa Karakoy”分析器和编译器辅助自适应I / O共享存储缓存预取”,协议的08年10月25 - 29,2008年,多伦多,安大略省,加拿大。
全球技术峰会