关键字 |
时钟功率降低,合并,导线长度、置换、multi-bit触发器。 |
介绍 |
时钟系统和逻辑部分消耗主要部分的芯片功率20 - 45%。在这个时钟系统力量,90%被拖鞋[1]。这是由于高转换活动。 |
(1) |
Pclk时钟权力,fclk时钟频率,Vdd是电源电压,和Cclk开关电容包括栅电容的拖鞋。 |
在时钟树综合,少数量的人字拖意味着更少数量的时钟下沉。因此产生的时钟网络会更小的功耗,并使用更少的路由资源。总功率是减少更换2位人字拖两人字拖拖鞋,有两个出使用相同的时钟。然而有些人字拖会被改变后的位置替换,因此网连接插脚的wire-lengths翻转,失败也发生了变化。 |
一位触发器可以使用多一点之前检查触发器。图1.1显示了一个示例singlebit触发器。一位触发器有两个插销(主锁和奴隶锁)。门闩需要“时钟”和“时钟”信号来执行操作,图1所示。 |
为了有更好的延迟从Clk - > Q,再生“时钟”从“时钟”。其他e ar e两个逆变器时钟路径。图2显示了一个示例合并两个比特的人字拖到一个2比特触发器。每个比特触发器包含两个逆变器,master-latch slave-latch。由于生产规则,逆变器在人字拖是超大号的。 |
随着工艺技术的进步为更小的几何节点,时钟驱动的最小大小可以开多个触发器。合并了人字拖到一个multi-bit触发器可以避免重复逆变器和动态功耗降低了总时钟。 |
文献调查 |
1)p . Gronowski w . j . Bowhill r·p·普雷斯顿·m·k·延命菊,R.L.Allmon”,与多比特翻转后放置电源优化——失败,“IEEE j .固态电路,33卷,没有。5、2012年5月,页676 - 686。 |
概念 |
替换几个一点触发器多一些触发器来减少总面积和动态功率可以减少高达50%。 |
缺点 |
Windows优化技术是大,以便触发器可以执行缓慢 |
2)d . Duarte诉Narayanan, m·j·欧文“权力意识到位置,”在Proc。IEEE VLSI第一版。Soc。为基础。计算机协会。,Pittsburgh, PA, Apr. 2005, pp. 52–57. |
概念 |
重点是计算不同触发器的空闲时间和控制逻辑插入网表来达到总功率的25.3%。 |
缺点 |
网络开关电源可以通过时脉,然后也可以减少25.4%。 |
3)h . Kawagachi和t .樱井技术扩展在时钟的影响力量,“挖在超大规模集成电路。科技论文计算机协会。,Jun. 2003, pp. 97–98. |
概念 |
增加了灵活性,时钟分布和时钟产生电路消耗总功率的40%。 |
缺点 |
时钟脉冲相位差问题可以降低30%。 |
4)W。后,刘,林志信。Ho”自动登记银行低功率时钟树,“在Proc。电子质量。设计,圣何塞,2010年3月,页647 - 652 |
概念 |
取代多位数一些触发器,触发器在不影响性能和总导线长度可以减少20 - 30%。 |
缺点 |
使用双位触发器保存时钟在11 .22%和替代触发器在切换率是10.43%。 |
5)郑y,林志信。Ho a . b . Kahng s Reda,问:王,“高性能微处理器设计,”奥特曼Proc。设计。相依,小君。1998年,页795 - 800。 |
概念 |
集中在高频设计实现高绩效和改善电路的复杂性。 |
缺点 |
在单电源电压系统时钟功率降低25.45%,并在多个电源电压系统时钟电源可以减少26.15%。 |
算法 |
T h e设计流程大致可以分为三个阶段。第一次使用组合表把拖鞋的所有可能的组合。这个问题的难度就是反复搜索一组人字拖,可以取代一个新的multi-bit触发器。然而,人字拖在芯片数量的增加显著的复杂性会增加指数使这种方法不切实际。更有效地处理这个问题,为了得到更好的结果,下面的流程图。图3显示了各种方法中使用的算法。 |
1)为了便于识别可以合并flip -失败改变细胞的坐标系统。这样的内存用于记录可行的放置区域也可以减少。 |
2)为了避免浪费时间在寻找人字拖的不可能的组合,首先建立一个组合表在实际合并之前两人字拖。例如,如果一个图书馆只提供三种人字拖1 -,2 -,3-bit首先分离拖鞋分成三组。因此1 -和3-bit拖鞋是不被认为是自库没有提供4比特触发器的类型。 |
3)芯片分割成几个子区域和执行替换在每个子区域减少复杂性。然而,这种方法可能降低质量的解决方案。解决问题使用分层的方式来增强结果 |
答:地区分区识别可以合并触发器 |
降低复杂性,首先将整个放置地区分为几个分区,然后通过使用组合表取代彼此子地区的人字拖。然后几个次区域组合成一个大次区域和拖鞋再次取代那些人字拖在邻近的次区域进一步可以更换。最后那些人字拖伪类型删除在最后一个阶段,因为它并没有提供的支持库。 |
b .替代触发器 |
结合已建成后的更换拖鞋根据组合表。第一人字拖在图书馆下面对应的组合类型有关。然后为每个组合n T,连续从下面链接的人字拖合并左孩子和n从树叶根。基于二叉树查找组合与根的左孩子和右子。因此列表中的拖鞋叫左派和lright链接低于它的左子的组合及其对孩子检查。然后为每个触发器f i lleft lright最好的触发器fb的触发器,可以用最小的成本与f合并我记录在cbe,是选择。每一双人字拖结合成本计算,它们可以以最小的成本为选择合并。最后在列表中添加一个新的触发器f组合的n和移除拖鞋构成f。例如,给定一个库包含三种类型的拖鞋(1 -、2 - 4位),首先建立一个组合表T Figure5所示。 |
上面的图表示 |
(一)合并前的人字拖。 |
(b)两个比特人字拖,f1和f2 2比特取代触发器f3。 |
(c)两个比特人字拖,f4和f5被2比特触发器f6所取代。 |
(d)两个2比特人字拖,f7和f8,被4比特触发器f9所取代。 |
(e)两个2比特人字拖,f3和f6被4比特触发器f10所取代。 |
合并后(f)的人字拖。 |
一开始,各种类型的人字拖,分别链接下面的n1、n2和n3 T根据他们的类型。假设形成一个触发器在陶瓷需要两个比特拖鞋根据组合选择表然后每一对拖鞋在n1和检查,看看他们是否可以组合如果有几种可能的选择和最小的成本价值选择的领带。 |
c组合表和合并触发器 |
最后在列表中添加一个新的触发器f组合的n和消除了人字拖也构成了f .Pseudo类型是一个中间类型用于枚举所有可能的组合组合表中的T,然后把拖鞋属于伪类型。因此应用了上述程序后de-replacement和替换函数执行是否存在flop-flops属于伪类型如图6所示。 |
这个数字表示, |
(一)初始化库土地组合表T。 |
(b)伪类型添加到L,和相应的二叉树也是构建。 |
(c)新组合n3获得结合两个n1。(d)获得新组合陶瓷结合n1和n3。 |
获得(e)新组合n6 combiningn1和陶瓷。(f)去年获得组合表删除未使用的组合(e)。 |
例如,如果仍然存在一个触发器,fi,更换后属于n3图(图。最后结合表获得后删除未使用的组合),然后de-replace fi为两个拖鞋最初属于n1。de-replacing后,更换拖鞋根据T不考虑相应的组合类型是伪L建成。 |
各种方法的比较表 |
这个表指定触发器的各种实现优化权力和实现净交换活动。尽管司机非常宽的设备发现的所有技术的时钟力量,是由于泄漏最多2.5%。技术优化和动态运行时技术减少forleakage wi l l成为时钟权力和标准仍将整个系统力量的主要因素。 |
传统的条件数据映射 |
D触发器 |
在条件数据映射触发器(CDMFF)只使用s e v e n监测晶体管,r e s u l t i n g在定时的晶体管的数量减少50%左右。这表明的有效性降低以达到低功率晶体管数字。图7显示了CDMFF的线路图。 |
在传统的D触发器时钟的一部分能量消耗的内部时钟缓冲控制传输门。 |
定时对共享触发器设计 |
确保高效和健壮的低功率序列元素的实现提出一个定时对共享触发器使用不如CDMFF定时晶体管和克服CDMFF浮动的问题。图8显示了CPSFF的框图。 |
通过减少晶体管数量没有整体切换延迟,权力,和区域消费可以减少。低功率监测通过晶体管FLIP -失败低功率监测通过晶体管触发器区域显示更少的电力设计约束比现有的两个触发器的设计。LCPTFF将有非常少的时钟延迟相比,所有其他电路。 |
输出波形 |
值PR_Ratio和WR_Ratio可以由以下公式计算 |
|
|
结论 |
人字拖在芯片数量的增加显著的复杂性会成倍增加,使得这种方法不切实际。更有效地处理这个问题和得到更好的结果,以下方法used.1)为了便于识别可以合并拖鞋改变细胞的坐标系统。这样的内存用于记录可行的放置区域也可以reduced.2),以避免浪费时间在寻找可能的组合拖鞋首先建立一个组合表在实际合并两个lipflops之前。3)芯片分割成几个和执行替换分区单元,在每一个次区域降低复杂性。然而这种方法可能降低解决方案的质量。解决问题使用分层的方式来增强的结果,可以减少处理时间。 |
表乍一看 |
|
|
数据乍一看 |
|
|
|
|
|
图1 |
图2 |
图3 |
图4 |
图5 |
|
|
|
|
|
|
图6 |
图7 |
图8 |
图9 |
图10 |
|
|
|
|
图11 |
图12 |
图13 |
|
|
引用 |
- Y.-T。常,c c。许,林志信。林,Y.-W。蔡,S.-F。陈,“充填后力量优化multi-bit flip -失败,”Proc.IEEE / ACMComputer。辅助设计Int,相依。圣何塞,CA, pp。218 - 223年,2010年11月。
- d . Duarte诉Narayanan, m·j·欧文”影响时钟技术扩展的能力,”Proc。IEEE VLSI第一版。Soc。为基础。计算机协会。匹兹堡,PA, pp, 52-57, 2002年4月。
- 郑y,林志信。Ho a . b . Kahng s Reda,问:王,“节能放置”Proc。设计奥特曼。相依Jun.2005,页795 - 800。
- Yu-Cheng Lin Guo-SyuanLiou Tsai-Ming谢长廷,“使用Multi-Bit触发器时钟Designcompiler节电”,July-12/2006
- y . j . Yu和y . c . Lim”扩展影响动态功率降低计划的有效性,“IEEE反式。CircuitsSyst。我,注册。论文,54卷,不。10日,第2338 - 2330页,2002年10月。
- 施d和y . j . Yu”,一个新的减少时钟触发器对于未来Soc的应用程序,“IEEE反式。电路系统。我,注册。报纸,卷。58岁的第一页。126 - 136年,2012年1月。
- H。简,C。林C, H。黄H T。谢长廷,“时钟网络节能使用多一些触发器在多个电压设计,“IEICETRANSACTIONS基础电子、通信和计算机科学2010年,pp.761 - 768。
- 457年c出生和j . Kerbosch”算法:找到所有派系的和无向图,“ACM Commun。,16卷,不。9,pp. 575–577, 1973.
- l .黄y Cai,问:周,x, j . Hu和y,“时钟网络最小化方法基于增量位置,”Proc.IEEE / ACM南太平洋亚洲Des,奥特曼。相依。,2005年1月,页99 - 102。
|