关键字 |
华莱士乘法器,降低复杂度,功耗,延迟。 |
介绍 |
数字信号处理器在设计上具有DSP算法的实时性。DSP的基本构件是乘法器、算术逻辑单元和乘法累加单元。对于实时应用,数字信号处理器计算模块设计的关键问题是速度和精度[1]。乘法对于计算机、过程控制器、微处理器、数字信号处理和图形引擎来说是必不可少的。在DSP处理器中,乘法是由乘法器来完成的。所以,系统的性能是由乘数的性能决定的。因此,人们提出了各种乘数结构来提高乘数的性能。 |
在低功耗和高速方面,驱动高性能电子系统设计的因素有很多[2-3]。随着最近技术的进步,许多研究人员致力于设计越来越高效的乘法器。主要目的是提供更高的速度和更低的功耗。这使得它们能够兼容各种复杂和便携的VLSI电路实现。乘数结构框图如图1所示。该乘法器结构由三部分组成:部分积的生成、部分积的加法和最终加法。 |
|
图1。乘数结构框图 |
并行乘法器是高速乘法器。有很多的乘数架构可以用来设计并行乘数。华莱士乘数就是其中之一。华莱士树是一种有效的数字电路硬件实现方法。它可以用两个整数相乘。基于华莱士树结构的乘法器称为华莱士乘法器。它基本上比其他乘数[4]快。 |
本文研究了几种类型的华莱士乘法器架构,与传统的华莱士乘法器相比,它们具有降低复杂度、低功耗和更短的延迟。 |
相关工作 |
传统华莱士倍增器 |
传统的华莱士乘法器是一种高效的并行乘法器。华莱士乘法器结构也有三个步骤。第一步,生成部分积。如果是NxN位的乘法,则产生N2个偏积。在部分积的累加中,收集相邻三行的一组。每组三行通过使用全加法器和半加法器来减少。每一列使用全加法器,每一列有3位,而每一列使用半加法器,每一列有2位。如果在任何阶段中有任何单个位,那么它将被传递到下一阶段而不进行任何处理。约简的过程是重复的,除非得到两行[4]。图2为9位传统华莱士倍增器结构[5]。 This figure shows that the multiplication is achieved in three steps and the number of rows in the initial bit product array is nine. |
对于n位乘法器,初始位积数组r0的行数为n。常规华莱士乘法器后续阶段的行数可以写成[5] |
|
|
这里,ri表示组或阶段,ri mod 3表示ri/3的最小非负余数。使用eqn.1计算了传统9位华莱士乘法器后续级的行数。对于常规的9位华莱士乘法器,r0=N=9, r1=6, r2=4, r3=3, r4=2。 |
|
图2。9位传统华莱士倍增器 |
降低复杂度华莱士乘法器 |
Waters等人提出了降低复杂度的Wallace乘数方法。图3[5]显示了降低复杂度的华莱士乘法器。它是对传统华莱士乘法器的第二相约简方法的改进,减少了半加法器的个数。第一阶段,形成部分积阵,并将其转换为倒金字塔阵的形式。当部分积数组的左半边位向上移动时,就形成了倒金字塔数组。在第二阶段,将该数组分为三行一组,每列使用全加法器。只有当改进的华莱士乘法器的降阶数超过传统的华莱士乘法器时,才使用半加法器。所以这种方法减少了半加器的数量。 |
在改进的Wallace乘法器中,如果(ri mod 3) = 0,则约简阶段需要半加法器;否则不需要半加法器。在这种架构中,半加器的数量等于N-S-1,其中N是比特数,S是阶段数。对于使用Wallace乘法器结构的9位乘法,在第一和第二阶段只使用一个半加法器,在最后阶段使用两个半加法器,如图3[5]所示。因此,可以观察到,与传统Wallace乘法相比较,该改进Wallace乘法相比较多使用了2个全加法器,少使用了17个半加法器,而约简级数与传统Wallace乘法相比较不变。 |
|
表1[5]显示了8位、16位、24位、32位和64位大小时,传统Wallace乘法器和简化Wallace乘法器的复杂度比较。该表显示,使用两种乘法器产生相同数量的缩减阶段,但修改或降低复杂性华莱士乘法器具有降低门数量复杂性的优势。 |
表1:复杂性比较 |
|
|
新型低功率高速华莱士倍增器 |
一种新型的低功耗高速华莱士乘法器,采用进位节省加法算法,降低了整体延迟[6]。这将提高速度并降低功耗。这是通过使用压缩器来代替全加法器,并使用斯克兰斯基树加法器来代替最后的进位传播阶段来实现的。用于RISC处理器的新型低功耗高速华莱士乘法器如图4[6]所示。在部分积约化阶段,如果使用的加器数量减少,相应减少华莱士树乘子中的延迟。在这个乘数中,两个延迟为4个单位的全加法器被一个延迟为3个单位的4:2压缩器取代,一个延迟为4个单位的5:2压缩器取代三个延迟为6个单位的全加法器。在结构中使用斯克兰斯基加法器进一步降低了延迟。 |
|
视图。新型低功率高速华莱士倍增器 |
布斯重新编码了华莱士树乘数 |
布斯编码华莱士树乘法器由布斯编码算法和压缩加法器组成,用于布斯编码乘法器的实现。在该体系结构中,采用Booth Recoding算法来生成和减少乘法器的部分积,采用3:2、4:2和5:2的压缩器结构来减少部分积相加的阶段数。在这些压缩器中,通过用多路复用器块替换异或块来最小化临界延迟路径。最后两行求和使用进位选择加法器产生最终结果。该结构具有速度快、占地面积小的优点。 |
高效高速华莱士树乘法器 |
与传统的Wallace树乘法器相比,该乘法器由压缩加法器和改进的进位选择加法器[8]组成。在该结构中,在第二阶段使用4:2和5:2压缩器进行部分积的减少,而在最后阶段使用进位选择加法器进行两行位的相加,以减少华莱士乘法器的进位传播延迟。 |
与传统的Wallace乘法器相比,高效的高速Wallace树乘法器结构具有减小延迟和降低功耗的优点。表2[8]显示了使用8位常规华莱士乘法器和8位高效高速华莱士树乘法器架构的晶体管数量和延迟的比较。这个表显示,与传统的华莱士乘法器相比,由于晶体管数量的减少,使用高效的高速华莱士树乘法器也减少了面积。 |
表2。晶体管数量和延迟的比较 |
|
华莱士倍增器采用节能cmos全加法器 |
图5[9]给出了采用节能CMOS全加法器的华莱士乘法器结构框图。该方法采用节能CMOS全加法器代替传统的全加法器[9],设计了改进的降低复杂度的华莱士乘法器,降低了功耗和面积。这种倍增器结构减少了功耗,也减少了门计数的总数。在该架构中,采用节能CMOS全加法器代替传统的全加法器。这降低了整体功耗,也提高了速度。 |
|
微型计算机体积很小。华莱士乘数采用节能CMOS全加法器 |
结论 |
本文研究了几种类型的华莱士乘法器结构,并与传统的华莱士乘法器结构进行了比较。可以观察到,通过降低复杂性和使用有效的加法器,华莱士乘法器结构在功率、延迟和面积方面具有更好的性能。 |
参考文献 |
- Wallace, c.s.,“一个快速乘数的建议”,IEEE计算机汇刊,第13卷,第14-17页,1964年。
- Kumar, M., Hussain, M. A.和Paul, S. K.,“使用亚阈值泄漏控制技术的双输入Nand门的性能”,电子器件杂志,第14卷,第1161-1169页,2012。
- Kumar, M., Hussain, M. A.和Singh, L. K.,“使用GDI技术设计低功耗高速45nm ALU及其性能比较”,计算机与信息科学通信,施普林格柏林海德堡,第142卷,第458-463页,2011。
- Gandhi, d.r., and Shah, N. N.,“Wallace树乘法器硬件电路架构的比较分析”,IEEE智能系统与信号处理国际会议,古吉拉特邦,pp. 1-6, 2013。
- 斯瓦兹兰德,E. E.和Waters, R. S.,“降低复杂度的华莱士乘数缩减”,IEEE计算机学报,第59卷,第1134-1137页,2010。
- Vinoth, C., Bhaaskaran, V. S. K., Brindha, B., Sakthikumaran, S., Kavinilavu, V., Bhaskar, B., Kanagasabapathy, M., and Sharath, B.,“一种用于RISC处理器的新型低功耗高速Wallace树乘法器”,IEEE第三届电子计算机技术国际会议,Kanyakumari, 330 - 334页,2011。
- Dubey, S.和Rao, M. J.,“用于快速算术电路的高速和区域高效布斯重新编码华莱士树乘法器”,IEEE亚太微电子与电子研究生研究会议,海得拉巴,第220 - 223页,2012。
- Sureka, N., Porselvi, R.,和Kumuthapriya, K.,“一种高效的高速华莱士树乘法器”,IEEE信息通信与嵌入式系统国际会议,金奈,1023-1026页,2013。
- Khan, S., Kakde, S.和Suryawanshi, Y.,“使用节能cmos全加法器降低复杂性Wallace乘法器的VLSI实现”,IEEE计算智能与计算研究国际会议,Coimbatore, pp. 1-4, 2013。
|