所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

低功率的概念内容可寻址存储器(CAM)芯片设计

德扬吉奥吉夫
博士生,电子和信息技术学院——斯科普里,马其顿
相关文章Pubmed,谷歌学者

访问更多的相关文章国际先进研究期刊》的研究在电子、电子、仪表工程

文摘

内容可寻址存储器(CAM)是一个内存单元,执行单时钟周期内容匹配,而不是地址。凸轮的大量使用查表功能,网络路由器和缓存控制器。自执行基本的查找所有存储内存信息有一个高功率耗散。现实中总有功耗之间的权衡,区域使用和速度。这里提出了一个概念的抽象内容可寻址存储器芯片在架构级别降低电力需求基于节电技术的组合和修改。

关键字

电力、建筑、XOR港口,凸轮细胞,芯片,设计

I.INTRODUCTION

内容可寻址(CAM)是快速记忆数据并行搜索电路。不像标准的记忆回路,例如随机存取存储器(RAM)对所有存储的信息进行数据搜索单时钟周期。事实上凸轮是RAM的产物。当凸轮的广泛应用于许多应用程序内存映射、缓存控制器为中央处理单元,数据压缩和编码等主要应用程序是快速的互联网协议(IP)包分类和高速转发网络路由器和处理器。协议的IP路由是通过检查头字段即源和目的地址,传入和传出的端口等对存储路由表中的信息。如果注册匹配包转发到端口(s)中定义的表。在高速网络和巨大的交通量要执行的任务是快速和大规模的并行性。然而,管理高速度和大查找表需要硅面积和功耗。功耗,硅面积和速度三个主要挑战设计师。因为他们之间总有取舍,减少一个不牺牲其他的是最近的研究是主要的治疗对于大型凸轮[2]。 Finding a solution could be approached on circuit or architectural level. Here is presented the later.
剩下的纸是组织如下。第二节是指一个相关的工作范围。第三节国家要解决的问题和实现的技术。的建筑设计提出了凸轮芯片设计。第四部分是评价结果和讨论的问题。工作的结论给出了在上一节5。

二世。相关工作

凸轮硬件已经推出数十年之久,许多研究开发高容量和有效解决凸轮在电路设计,架构和应用水平。很多项目都倾向于“真实生活”申请有效算法基于摄像头的包转发,即扩展版本。三元凸轮(TCAM) [1]。凸轮记忆增强与“不在乎”国家用于更复杂的项目硬件基于网络入侵检测和预防系统(NIDPS) [9]。在“低”层面设计许多论文介绍方法和优化速度,力量和物理电路资源。[2]的作者详细描述了CAM功能晶体管的原理和电路包括核心细胞水平,线和搜索匹配线结构和功耗配方。还提出了功率和面积减少技术电路水平。提出了实用的设计架构级别[4]。该凸轮芯片设计是基于修改内存芯片电路中解释[5]

三世。凸轮芯片设计

基本的凸轮细胞功能可以观察到两个:一点一点存储在RAM和比较是独一无二的凸轮。在晶体管即电路级凸轮结构实现为NAND-type或NOR-type及其变体被解释为[2]。但在建筑层面一些存储使用简单的细胞(S)的RAM和比较函数相当于XOR即XNOR逻辑操作。因此我们的基本细胞芯片设计是抽象的叉积SRAM和XNOR电路。图1展示了逻辑电路符号和编译。
输入信号是一个比特值的搜索数据寄存器即输入词比较对所有存储在凸轮数组中的值或值存储在CAM单元。即细胞启动信号允许或阻止比较匹配过程意义XOR-ing比特值存储在触发器和输入。应该提到的扩展的真值表的三态缓冲器在表1 x代表输入信号和y是输出信号。“Z”表示高阻抗或断开连接的线或开关开/关。
功耗在每一个细胞出现在匹配状态或甚至在失踪状态因为比较过程是在两种情况下进行。细胞启动信号即三态缓冲的目的是“断开”细胞从匹配的过程,从而从电力消耗的过程。
答:一个细胞分割权力减少计划
常规内容可寻址的记忆就像前面所提到的数据搜索过程是统一执行的所有细胞数组,因此在每一个细胞产生热量。想提出一些技术可以缓解这个问题。当执行一个搜索,如果前几位不匹配是没有意义的检查剩余的部分。选择性pre-charge最初搜索只有前n位,只有搜索其余部分单词匹配第一个n比特。与均匀随机数据只需要搜索(1 / 2)n行。n = 3这将节省大约88%的比赛线路功率[2],[3]
选择性pre-charge方案基本上把马赫线在两段。一般遵循同样的概念可以分为许多部分形成一个管道。如果任何阶段错过后续阶段的关闭导致节电。该方案的缺点是增加了由于管道阶段延迟和面积开销。这里显示的是一个节能设计翻松的速度即增加延迟但保留相同的电路面积。这个概念背后的基本思想是马赫线的分割,每个凸轮细胞形成一个部分的,因为它是在图2。
该方案的主要好处来自实现凸轮细胞显示在图1。即细胞是细胞的输出启动信号的连续位比较从而减少额外的盖茨转移细胞的结果。缺点是增加了传播延迟,来自三态缓冲和XNOR门在每个细胞。典型凸轮由单词长度从36到144位,在实践中应该是可以接受的延迟值。应该注意的是,一个细胞分割方法在这里讨论的是一种概念性的观点,而不是真正的节能方案,可以实现循环水平。
b .奇偶校验预先估计功率减少计划
内容可寻址的记忆是广泛使用在网络路由器的IP包转发或包过滤防火墙和NIDPS系统。IPv4基本滤波器组5-tuple定义在头字段{来源IP、目标IP,源端口,目的端口,协议}每个等于{32位,32位、16位、16位,8位}分别长。,104位字凸轮是必需的。另一方面大多数过滤器和NIDPS规则定义的端口范围例如[1024:2048]。用凸轮没有实现“不关心”这个词将会获得字段重复增加端口位1。它不仅需要巨大的内存区域但不必要的权力失去了一些比较即使pre-charge或管道使用方法。例如,对于固定源IP地址和目的IP地址计算将所有第一个64位无论残留一些字段。在问候的改善可以通过统计预先估计在word的碎片。
预先存储一些额外的位来自存储词和用于主要的初始搜索在搜索词。如果初始搜索失败,主要的单词搜索是流产,从而节省电力。图式的概念呈现在图3。
一个方法使用预先估计电路计算和存储这些数据的二进制格式的词。为预先保留的比特数是日志(2)2 n¯€«[8]。作为第一步预先估计比特为每个存储的话,对于那些比较匹配过程继续搜索的数据。一个可能的解决方案在圆形水平的统计参数提取器包括并行和串行连接完整的蛇(FA) [7]。执行数据字位的计算分为三段。它值得注意的是,简单的足总在电路级实现两个,XOR和一个或两个盖茨[5]。1数预先计算凸轮的主要缺点提出了长数据字。第一个问题是复杂的计算方案创建大量的完整的蛇组装。第二个问题我们抱怨失去了硅的区域用于存储预先计算的部分。
作为妥协这里提出新颖简单的预先估计算法。这个解决方案套件在以前提拔一个细胞分割管道功率降低计划,包括:而不是计算1的数量(或0)我们只检查1的数据的奇偶校验。均匀分布的半功率降低。与计数的方案相比我们有力量拯救,但在术语使用的复杂性和区域这个计划提供了改进。多一些平价计算只需要一点(k = 1)来存储结果。间接地降低计算复杂性速度增量的影响。简单逻辑电路位奇偶校验计算实现只有XOR盖茨如图4所示。结果结果是一些' 1 '的奇数的数据字并为偶数的“0”。
很有趣,XOR-ing可以在任意位置比特而不是相邻的。相似的电路用于所谓Block-XOR计算块实现统一的比较[7]。
c .凸轮芯片架构
到目前为止,讨论基于方法更明确提出一个细胞的组合分割管道和奇偶校验功率降低的机制我们可以设计完整的内容可寻址存储器体系结构显示在图5。它实际上代表了小4 x4凸轮芯片每行包含存储词包括参数的一点记忆。2 - 4译码器是为编写函数仅用于行选择。重要的是要注意,凸轮芯片不需要时钟信号,除了新的存储的数据寄存器值比较是一个全球性的系统时钟同步。自三态缓冲器在每个存储单元充当有点比较凸轮开关函数,凸轮使(CE)信号可以认为随着全球凸轮芯片的开关信号。
CE = 0时所有参数存储单元屈服于禁用流程寻找剩余的细胞。4的输出行凸轮内存4-to-2编码器生成二进制表示匹配的行号。通常优先编码器已经使用。

IV.PERFORMANCE评估和讨论

力量减少技术总是在平衡区域或逻辑处理速度。这里提出的方法相比设计需要平等或更少的区域资源,尤其是参数提取器。所有的电力减少达到增加时间延迟。因为比赛过程应在一个时钟周期内完成整个系统延迟是将合适的时钟周期内,如图6所示。整体延迟T完全匹配的每个组件的所有连续的延迟
T一个¯€½T一个¯€«nA¯´
其中t代表的延迟参数提取器和一个¯´的延迟凸轮细胞。
一个可能改善的速度和复杂性可以通过预先估计比特的分割,达到意义执行检查只对一些人来说,例如最后一位相反的位在数据的话。
力量保存在一个细胞分割比常规的管道,但位奇偶校验预先估计达到减少相比以前的方法。
另一个设计考虑的实际实现三个国家缓冲和XNOR门与输入信号“Z”作为操作数。使用硬件描述语言(VHDL)使用IEEE为仿真的目的。STD_LOGIC _1164包即STD_LOGIC信号定义我们的CAM单元设计套件。

诉的结论

本文全面凸轮芯片模型设计架构级别。还结合两个力量减少技术:管线式发电计划和修改基于预先估计的方法。首先我们分段管道单一细胞阶段每个积极的比赛在给定阶段充当第二开关状态匹配从而显示,不需要额外的循环要求在每个单元门的比较是在一些早期的研究。第二个改进是提议是预先估计新算法。位奇偶校验需要较少的参数内存空间和快速执行。当然,它有一些缺点像更少的功率降低。最主要的挑战依然存在:基于项目的建议方法凸轮网格电路水平。

表乍一看

表的图标
表1

数据乍一看

图1 图2 图3
图1 图2 图3
图4 图5 图3
图1 图2 图3

引用