所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

31 -阶FIR低通滤波器的设计和实现,使用改进后的基于FPGA的分布式算法

Shrikant帕特尔
PG的学生,电子和通信,东方大学印多尔,印度
相关文章Pubmed,谷歌学者

访问更多的相关文章国际先进研究期刊》的研究在电子、电子、仪表工程

文摘

本文提供的原则修改分布式算法,并引入到FIR滤波器设计,然后给出了一个使用修改31-order冷杉低通滤波器分布式运算,节省相当大的MAC模块降低电路规模,与此同时,附近地区划分方法用于减少所需的内存单位和管道结构还用于提高系统速度。FPGA上的实现FIR滤波器基于传统方法成本相当大的硬件资源,这对减少电路系统的规模和增长速度。众所周知,冷杉过滤器由延迟元素组成,乘数和蛇。因为使用乘数的设计产生2缺点面积增加(i)和(ii)增加延迟最终结果在低性能(速度)。新设计和实现FIR滤波器使用本文提供修改后的分布式算术来解决这个问题。修改分布式运算结构用于增加资源的使用而管道结构还用于提高系统速度。此外,附近地区划分方法还用于减少所需的内存单元。修改的分布式算法可以节省大量的硬件资源利用附近地区来代替MAC单位。仿真结果表明,FIR滤波器,使用改进后的分布式算法几乎可以与高速和稳定的工作可以节省硬件资源减少不到50%电路规模,并可以应用于各种领域的极大的灵活性和可靠性高。本文设计一个滤波器的主要文摘根据修改的分布式算法,我们可以查阅表(附近地区)保护MAC值和调出根据输入数据的值。 Therefore, LUT can be created to take the place of MAC units so as to save the hardware resources.

关键字

分布式算术(DA),现场可编程门阵列(FPGA),有限脉冲响应(杉木),查找表(附近地区),管道。

介绍

过滤器是一个所有信号处理和通信系统的基本组成部分。过滤器广泛用于信号处理和通信系统应用,如信道均衡、降噪、雷达、音频处理、视频处理、生物医学信号处理和分析经济和金融数据。例如在无线电接收机带通滤波器,或调谐器,用于提取信号从一个广播频道。数字滤波器分为两类,包括有限脉冲响应(杉木)和无限脉冲响应(IIR)。和FIR滤波器广泛应用于各种数字信号处理领域提供线性相位和系统稳定性的优点。
图像
c (i) =常数或滤波器系数
x (i) = n点的输入序列是可变的
y (n) =代表了系统响应
有限脉冲响应(杉木)过滤器是最受欢迎的类型的过滤器在软件中实现。数字滤波器是数字输入,给出了一个数字输出,包括数字组件。在一个典型的数字滤波程序,软件运行在一个数字信号处理器(DSP)读取输入a / D转换器采样fpga FIR滤波器使用传统直接计算成本相当大的大量增殖和积累(MAC)块滤波器的增加的订单。然而,根据分布式算法,我们可以查阅表(附近地区)保护MAC值和调出必要时根据输入数据的值。因此,附近地区可以代替MAC创建单位,以节省硬件资源。本文提供分布式算法的原理,并介绍成FIR滤波器的设计,然后给出了一个使用修改31-order冷杉低通滤波器分布式运算,节省相当大的MAC模块降低电路规模,与此同时,附近地区划分方法用于减少所需的内存单位和管道结构还用于提高系统速度。

分布式算术

算术求和的产品定义响应的线性、时不变网络可以表示为:
图像
地点:
y (n) =响应的网络时间n。
Xk (n) = ' k个输入变量在时间n。
AK =的权重因子k个输入变量,对所有n是恒定的,因此它仍是定常在过滤应用程序的常数,正义与发展党,滤波器系数和变量,xk,是之前样品单一的数据源(例如,一个模拟数字转换器)。频率转换——无论是离散傅里叶或快速傅里叶变换常数是正弦/余弦基函数和变量的样本块单一数据源。多个数据源的例子可以发现在图像处理。的multiply-intensive性质可以通过观察,欣赏一个输出响应需要K产品方面的积累。在DA的任务总结产品条款被查表程序,很容易在Xilinx中实现可配置逻辑块(CLB)查表架构。我们开始通过定义变量的数字格式2的补充,部分——\标准练习定点微处理器以一定数量的增长在乘法。不变的因素,正义与发展党,不必如此限制,也不需要匹配单词长度的数据,为微处理器一样。常数可能混合整数和小数格式;他们不需要被定义。变量,xk,可能写的部分所示的格式
图像
xkb在哪一个二进制变量,可以假设只有0和1的值。价值的符号位1是由xk0表示。注意时间指数n,已经下降了,因为它不需要继续推导。最终结果是得到第一次取代
图像
然后明确表达所有的求和符号下的产品条款:
y = - [X10.A1 + X20.A2 + X30.A3 +…………+ Xk0.Ak]
+ [X11.A1 + X21.A2 + X31.A3 +…………+ Xk1.Ak] 2 - 1
+ [X12.A1 + X22.A2 + X32.A3 +…………+ Xk2.Ak] 2 - 2
+ (x1b - 2. - a1 + x2b - 2. - 2. a2 + x3b - - a3 +…………+ xkb - 2. - ak) 2 - (b - 2)
+ (x1b - 1. - a1 + x2b - 1. - 1. a2 + x3b - - a3 +…………+ xkb - 1. - ak) 2 - (b - 1)
图像

过滤器的设计

在FIR滤波器的设计中,可以生成响在过渡带的边缘的原因,有限级数傅里叶变换不能产生尖锐的边缘。所以windows通常用于生产合适的过渡带,和Kaiser窗广泛用于提供良好的性能。参数一个¡AµAKaiser窗是一个重要的系数包括窗户类型。我们可以得到许多的windows像矩形窗,汉宁窗、汉明窗,和布莱克曼窗的调整¡AµA。31-order冷杉低通滤波器的设计是使用Kaiser窗,和参数如下:一个¡AµA= 3.39,w = 0.18。我们可以获得使用Matlab过滤系数如下:
h (0) = h (31) = 0.0019; h (1) = h (30) = 0.0043; h (2) = h (29) = 0.0062; h (3) = h (28) = 0.0061; h (4) = h (27) = 0.0025; h (5) = h (26) = - 0.0050; h (6) = h (25) = 0.0148; h (7) = h (24) = 0.0236; h (8) = h (23) = 0.0266; h (9) = h (22) = 0.0192; h (10) = h (21) = 0.0015; h (11) = h (2 0) = 0.0351; h (12) = h (19) = 0.0774; h (13) = h (18) = 0.1208; h (14) = h (17) = 0.1566; h (15) = h (16) = 0.1768。
在Matlab中描述数据浮点形式描述的定点在这个FPGA系统形式。使用12-bit-width签署了二进制量化后的滤波器系数,我们可以获得最终系数如下:
h (0) = h (31) = 4; h (1) = h (30) = 9; h (2) = h (29) = 13; h (3) = h (28) = 12; h (4) = h (27) = 5; h (5) = h (26) = -10; h (6) = h (25) = 30; h (7) = h (24) = - 48; h (8) = h (23) = 55; h (9) = h (22) = 39; h (10) = h (21) = 3; h (11) = h (20) = 72; h (12) = h (19) = 158; h (13) = h (18) = 247; h (14) = h (17) = 32 1; h (15) = h (16) = 362。
以上系数在Matlab, frequency-amplitude滤波器的特征描述为图2。
图像
我们应该设计31-order过滤器,过滤器订单的增加,附近地区的规模将大幅增加,这将花费更多的时间来查找表和更多的内存来存储值。因此,我们可以把单元分为四个小的附近地区单位来解决这个问题。小附近地区下面的系数值
图像

分布式算法冷杉过滤器

分布式算法是其中一个最著名的实现FIR滤波器的方法。DA解决了内积的计算方程系数是知识之前,发生在FIR滤波器。一个数字滤波器长度的K被描述为:
图像
其中h [k]是滤波器系数和x [k]是输入数据。为方便分析,x ' [k] = x (n - k)是用于修改方程(1),我们有:
图像
然后我们使用B-bit二进制补码的二进制数字代表输入数据:
图像
在Xb [k]表示第b的Xb [k], Xb [k]€{0,1}。替换(3)(2)收益率:
图像
在方程(4),我们观察到的滤波器系数可以预先存储在附近地区,和解决xb = [,,…]。这种方式,数字滤波器的实现使用这个算法是通过使用寄存器,内存资源和扩展蓄电池。原始LUT-based DA实现4-tap (K = 4)冷杉过滤器如图3所示。DA架构包括三个单元:移位寄存器单元,DA-LUT单元和加法器/移动装置。
图像
随着过滤订单增加,内存大小也增加。词根这反过来增加了查找表(LUT)的大小。所以我们使用组合逻辑的查表获得更好的性能。拟议中的DA-LUT单元大大降低了内存的使用,因为所有的单位可以被多路复用器和完整的蛇。
图像
图4 15-Tab冷杉滤波器结构基于分布式算术

b .修改分布式算术附近地区架构

在图3中,我们可以看到,附近地区的下半部(地点b3 = 1)是相同的与附近地区的上半部分的总和(地点b3 = 0)和h [3]。因此,附近地区的大小可以减少1/2与一个额外的2 x1多路复用器和加法器,如图5所示。同样的附近地区减少过程,我们可以最后LUT-less DA架构,如图6所示在其他方面,使用组合逻辑电路,滤波性能将受到影响。但当滤波器的水龙头是一个'我们可以用4-input附近地区单位与额外的多路复用器和完整的蛇之间的权衡过滤性能和小资源使用。
图像
图5为4-tap DA架构提出滤波器(2³词附近地区实施DA)
图像
图6 LUT-less DA 4-tap冷杉过滤器体系结构

最后框图31-TAB冷杉过滤器

上面的框图显示了最终的框图31 - Tab冷杉的过滤器。在这个图中由庇索移位寄存器,庇索意味着意味着并行和串行移位寄存器接收的数据并行形式,给出了串行形式。它也包含8种4 - Tab冷杉过滤器。为了这个目的。8附近地区的使用。这是修改后的附近地区基本的附近地区。这是流水线寄存器和移位寄存器之间的连接。当流水线寄存器使用元素,增加了系统的速度。附近地区- 0和附近地区- 1连接到加法器也没有。6附近地区连接到加法器的耦合形式后,添加单独的结果4附近地区的连接到个人加法器和最后两个添加结果添加最后一个加法器。 Final result of the entire adding is saved to the accumulator.
图像
图7 31-Tab冷杉滤波器结构基于分布式算术(附近地区——查找表,公关-流水线寄存器)

仿真结果基本的附近地区

图像
图8仿真结果基本附近地区

仿真结果的修改

图像

设计的总结基本的附近地区

图像
图10的设计总结基本的附近地区

设计总结修改附近地区

图像
图11的设计总结修改附近地区

合成的基本附近地区

图像
图12的合成基本附近地区

合成改性附近地区

图像
图13合成改性附近地区

RTL图解模型修改的附近地区

图像
图14 RTL图解模型修改的附近地区

结论

这个报告提出了高阶滤波器DA架构。架构减少内存使用减少一半在附近地区的每个迭代的成本系统的有限降低频率。我们也把高阶滤波器分成几组小过滤器;因此我们也可以减少的大小。随着高速FIR滤波器的实现,采用DA架构full-parallel版本。我们已经成功地实现了一个高效31-tap full-parallel DA过滤器,同时使用一个原始哒架构和修改哒架构4 vlx40ff668 FPGA设备上。这表明该DA架构硬件高效的FPGA实现。基于分布式算法的设计和实现,用于实现31 -阶FIR低通滤波器。分布式计算结构用于增加资源的使用而管道结构用于提高系统速度。测试结果表明,所设计的滤波器使用分布式算术能高速稳定,可以节省近50%的硬件资源。 Meanwhile, it is very easy to transplant the filter to other applications through modifying the order parameter or bit width and other parameters, and therefore have great practical applications in digit signal processing. After all implementation and simulation result of the basic LUT and modified LUT result .according to Fig. 8 and Fig. 9 these are the diagram of Basic LUT and modified LUT . these wave from result are same that mean basic LUT work with large memory space and modified LUT work with small memory space so that wave result of both LUTs are same. After that according to the design summary result, we take Fig. 10 and Fig. 11. These are the diagrams of Basic LUT and modified LUT. Now take the device utilization summary of Basic LUT.
图像
现在我们的设备利用率总结修改),
表3
设备利用率的总结修改附近地区
图像
之后,比较这两个设备利用率的总结基本附近地区和修改附近地区在基本附近地区没有的利用率。片的26%。但在修改后的附近地区是13%和386/4656利用率的比率是1233/4656。同样,在基本的附近地区没有利用。4 i / p附近地区的23%,但在修改后的附近地区12%,利用率的比率是759/9312。但是没有。带状入会的利用率比273/232是常见的附近地区和利用率是117%也是常见的。

未来的工作

直到现在所有的DA基于自适应滤波器是在一个普通的查找表实现发展是构建高效的查找表的方式抵消分布式算法的二进制编码。在这集的二进制编码,查找表正是从实际查找表减少一半。附近地区划分方法用于减少所需的内存单元或减少了电路规模和管道结构还用于提高系统速度。也有用在冷杉过滤器是用于数字信号处理。摘要基本附近地区使用,可以减少3时间意味着我们可以减少电路规模和提高系统速度3次,这样有很多冷杉滤波器基于DSP应用程序,这种方法可以使用,我们可以减少电路规模以及提高系统速度是本文的主要未来的工作。将过滤器很容易移植到其他应用程序通过修改订单参数或宽度和其他参数,因此有很大的实际应用在数字信号处理。这是有些地区高效过滤基于查找表,命名为分布式算法冷杉过滤器。

ACKNOWLADGEMENT

我感谢所有部门的电子和通信东方大学的教员印多尔,工作人员,帮助我在很多方面直接或间接的。我想把这篇文章献给我的家人和朋友,上帝,他给了我在困难时期支持的过程中完成。

引用

  1. 乌维Meyer-Baese。与FPGA数字信号处理[M]。北京:清华大学出版社,2006年。
  2. 曹Y C和崔k Area-Efficient并行FIR数字滤波器结构对称运算基于快速冷杉算法[J]。IEEE超大规模集成电路(VLSI)系统,PP (99), 2010。
  3. 斯坦利·A·白”,应用数字信号处理的分布式算术:教程审查,“IEEE ASSP杂志,6卷,页。4-19,1989年7月。
  4. 微积分,自适应滤波器理论,Prentice Hall,鞍上游,新泽西,1996。
  5. c·F·n·考恩和j . Mavor“新digital-adaptive过滤器使用distributed-arithmetic技术实现,“IEE诉讼,128卷,Pt。F。4,第230 - 225页,1981年8月。
  6. A·贝利和b .撒谎,“一个新的数字滤波器的硬件实现,”IEEE A.S.S.P.22卷,第462 - 456页,1974年12月。
  7. Partrick隆阿里•米里“Area-Efficient冷杉滤波器设计fpga使用分布式算术”IEEE信号处理和信息技术国际研讨会,页:248 - 252,2006。
  8. Sangyun黄、Gunhee汉Sungho Kang Jaeseok金,“新分布式算术算法低功耗数字滤波器实现”,IEEE信号处理信件,Vol.11,排名第五,页:463 - 466,2004年5月。
  9. Heejong Yoo大卫·V。安德森,“高阶数字滤波器Hardware-Efficient分布式算术架构”,IEEE国际会议音响、语音信号处理,第5页。125 - 128年,2005年3月。
  10. 秀洲,Xingwang卓“数字系统应用程序和设计基于Verilog HDL”,北京:国防工业出版社,2006。
  11. 麦克莱伦,J.H.公园卢铁荣拉宾,L.R.“一个计算机程序设计优化FIR线性相位数字滤波器”:。IEEE反式。音频Electroacoust。21卷,第6期,页:506 - 526年,1973年。
  12. m . Keerthi 1 Vasujadevi Midasala2 S Nagakishore Bhavanam3, Jeevan Reddy ' FPGA实现的分布式算术冷杉过滤器”国际工程研究与技术杂志》上(IJERT),卷1期9日- 2012年11月。
  13. Yajun周,平铮施“分布式算法在FPGA数字滤波器实现”IEEE国际会议多媒体技术,打印ISBN: 978-1-61284-771-9,页294 - 297,2011年7月。
全球技术峰会