ISSN在线(2320 - 9801)打印(2320 - 9798)
答:博士MUTHU KUMARAVEL1
|
相关文章Pubmed,谷歌学者 |
访问更多的相关文章国际期刊的创新在计算机和通信工程的研究
几乎是不安全的状态,没有一个应用程序图像获得或加工没有积极的或潜在的图像恢复。工作的中心是一个迭代的图像恢复算法的FPGA实现。硬件设计的图像恢复算法和估计性能的FPGA实现。在恢复图像的每个地区恢复为尽可能多的迭代,直到满足收敛性判据。硬件解决方案主要利用并行性的概念,以获得对软件实现加速。由于过多的硬件是需要恢复图像的实际大小,完成图像的统计方法进行分析,因此图像分割。结果表明,加速了实际系统对不同的图像变化在6.5和10.2之间。
介绍 |
图像生产记录或显示有用的信息。由于缺陷的成像和捕获过程,然而,记录图像总是代表一个退化的原始版本的场景。恢复是恢复的过程信息消除降解过程,通过操作可以获得恢复退化图像和图像尽可能接近原来的。图像恢复领域,有时被称为图像去模糊图像反褶积是关心重建或未堕落的图像模糊和噪声估计。从本质上讲,它试图执行一个操作的图像是图像中的缺陷形成的逆系统。 |
图像恢复的目的是为了“弥补”或“撤销”的缺陷,降低图像。退化有多种形式,如运动模糊,噪音,相机misfocus。在运动模糊情况下,是有可能想出一个很好的估计实际的模糊函数和“撤销”的模糊恢复原始图像。在噪声图像的情况下,最好的方法是为了弥补退化引起 |
几种方法用于图像处理世界来恢复图像。中出现了大量技术文献修复的问题提供解决方案。迭代图像重建算法的硬件实现FPGA(现场可编程门阵列)平台上。工作是基于一个基本的迭代修复算法。硬件实现的一个非常重要的方面是它的运行时间。可能的加速效果,可以通过实现这个算法在可重构硬件相比使用软件的实现算法。 |
二世。迭代图像重建算法 |
迭代过程背后的想法是让一些初始猜测基于g和f的更新,每次迭代后猜。这个过程是 |
0 (n1、n2) =λg (n1、n2) |
k + 1 (n1、n2) = k (n1、n2) +λg (n1、n2) - k (n1、n2) * * b (n1、n2) |
0是一个初始猜测基于g。如果k是一个合理的猜测,最终与b将接近g卷积。当这种情况发生时的第二个任期k + 1方程将消失,k和k + 1会收敛。λ是收敛因子,它让我们确定k和k + 1收敛速度。 |
卷积是最常见的操作之一,图像在空间域执行内核的数量乘以每个像素及其邻国在一个小区域,结果总结,结果用于计算像素的新值。这种方法也用于边缘检测,削尖点和线,平滑的图像。恢复一个像素,立即八周围邻居像素。我们定义这些像素作为来说,指定他们在距离1到中心像素。因此i-neighbors定义是那些像素,在距离我到中心像素。 |
在不同的图像修复算法迭代算法主要是由于以下几个原因。地方计算的算法具有一个模式的依赖一个像素的恢复值1 -邻居。这些类型的计算允许空间实现。 |
同时,同一地方重复计算的迭代次数和大量的数据。相关算法存在一些困难或挑战。任务一定顺序的所有像素的图像通过当前的恢复步骤,直到下一次迭代步骤就可以开始。这要求一个快速和大带宽通信线路,仅仅是不可用的。因此,分割图像和处理每一部分独立成为必要。 |
反过来,边缘效应变得越来越重要,该算法需要处理这个问题的另一个修改。结果,该算法需要经过一些基本的修改以符合资源和沟通的局限性。的收敛标准是剩余计算 |
迭代停止时残余<λ,λ是一个阈值集。的价值决定了收敛的迭代次数,因此收敛时间。 |
一个。软件和硬件资源有限 |
的轮廓图像修复算法如下: |
1。初始化剩余 |
从伪代码可以看出,该算法作用于一个像素,扫描图像和迭代重复多少次就停止准则规定。这个顺序实现速度非常慢。 |
b .硬件实现 |
我们的硬件实现的背后动机是想出一个更快的解决方案。硬件实现的基本设置包括一些介质存储图像数据和一个处理器执行恢复。包含数据的内存与处理器通信通过一个通道。 |
硬件实现的算法可以就像在软件模型,将9像素值发送到处理器,让处理器计算中心像素的新值和写作新值。要重复数的迭代步骤。由于内存和处理器之间的通信是缓慢将引入大量延迟。一种改进执行该任务的方法是利用算法的并行性(61。因为每一步相同的每个像素上执行恢复操作,对FPGA的硬件配置来执行这个任务,也就是一个处理器。 |
通过将一个像素分配给每个处理器可以并行处理所有像素,可以显著地提高性能的速度。同时,加载FPGA上的像素值,执行若干次迭代,然后结果写回内存,减少FPGA板之间的通信的开销和内存单元。这个模型是不现实的,因为有限的硬件资源。 |
处理器的数量,可以放入一个FPGA芯片的数量远远小于我们通常处理的图像中包含的像素。因此我们需要部分图像。图像分割成区域大小mx n, FPGA芯片上有足够数量的处理器并行处理所有的期望和每次加载一个段到FPGA。恢复一个段完成后数据写回,第二段加载。 |
减少这种影响的一个解决方案是允许部分重叠。段的大小(m + o) x (n + o)恢复然后重叠部分被丢弃。图2显示了图像的分割和一个段的尺寸。如果算法k迭代运行,第一个k像素边界的像素将开始受到边界效应的影响。因此理想的片段应该通过尽可能多的像素重叠迭代步骤的数量。这将不是很实用,因为大量的迭代重叠区域将再次溢出FPGA与像素。 |
在此条件下小的重叠区域选择牺牲一些错误引入像素值。边界上的像素值损坏由于第一次迭代的边界效应,在下一次迭代1的像素距离受到影响,在第三次迭代中邻居像素在距离2将会有一个误差项的像素值等等。邻居像素有一个体重rl如图1所示,这是一个数量小于1。中心像素的加权和,你的邻居像素乘以增益参数π也小于1。介绍的退化在图像的边界将扩散到室内时乘以这些系数提高到一个高功率,因此错误点后将变得微不足道。 |
三世。硬件方面的设计 |
在本节中,迭代图像重建算法的硬件实现进行了探讨。处理单元的结构,整个系统由FPGA板和主机处理器仔细审查。 |
答:资源规划和调度 |
使用此硬件平台,1 (m + o) x (n + o)段处理。计算结束后,返回一个m, n段。的基本构建块硬件处理器,装有一个像素值,需要八个邻近的像素值作为输入。那块计算下一次迭代一个像素的价值。每个处理器都可以交换数据与周围八个邻居,即。,处理器之间的数据可以在两个方向上移动。图4显示了这样的处理器。 |
每个处理器包含两个蛇,一个移动装置,一个减法器。乘法和除法操作,用于加权和的计算,是由这个应用程序的移动装置。在实践中,最快的实现将是中心像素乘以一个整数代表其重量和八个紧邻的另一个整数代表权重的邻居,和产品,然后总数除以公分母。 |
例如,如果中心像素分配重量½和邻居的重量的1/16,那么首先,中心像素乘以8重量by1 16和邻居的加重,而不需要一个实际的乘法,然后产品的总和除以16。选择权重是2的幂的计算可以通过执行只有极快一点转变。要仔细考虑,使用的重量中心像素和相邻的像素,以及增益参数,选择是2的幂。 |
因此,乘法和除法操作是由换档器左右变化,分别。处理器的硬件单元计划为了使用最有效的方法。图3给出了利用硬件单元对应的时钟周期。每个功能单元执行的计算每一步。为了充分利用算法的并行性,需要满足尽可能多的处理器的FPGA芯片。 |
不同系列的FPGA |
另一方面,实现资源限制。因此,处理器的数量有一个限制,设计可以包含,这取决于可用的硬件资源。因此,数组的大小取决于能力的处理器的FPGA芯片,用于实现 |
使用硬件描述语言(VHDL)和描述的硬件设计是设计合成系列F1.5软件使用Xilinx的基础。定时分析假定硬件包含8 x 8阵列的处理器2像素重叠允许为每个部分。图4给出了估计加速软件实现。恢复图像的可重构处理器与主机通信处理器。图像存储在主机处理器和最终结果也写回到主机处理器。 |
硬件上运行时间已经被计算估计恢复所需的时钟周期数,然后添加传输时间。所需数量的时钟周期源于调度。数据传输时间据估计通过考虑实际应用。 |
切换被选中,因为它需要很少的面积比一个乘数,并允许更快的计算为应用程序。减法也可以由使用一个现有的蛇和一些额外的硬件转化的一个数字被添加在表1不同Xilinx fpga已经被证明的能力。 |
四、统计分析的图像 |
由于资源约束整个图像不能并行处理。段图像方法考虑到算法的收敛性质。恢复在恢复图像的每个地区的许多迭代,直到满足收敛性判据。收敛性取决于几个因素,如获得参数0,权重的选择中心的像素和相邻的像素和像素值的分布在整个图像。工作在这个图像的像素值分布之间的相关性及其修复研究的收敛时间。如果这样的相关决定,设计方法可以检测它,利用它,以提高收敛时间。 |
第一个任务是调查是否存在一个区域中的像素值之间的相关性和该地区所需的迭代次数。统计方法来确定这和像素值的标准偏差在一个地区被选为指标。标准差为指示多少像素的值在一个地区是分开的。每个区域的分割图像的标准差区域内的像素已经计算并确定该地区所需的迭代次数。 |
这一观察问题是可以使用不同的方法来分割图像,这样得到的像素分布的地区将需要更少的迭代步骤。第一个方法是有固定分区窗口,并尝试采用不同的方向的这个窗口形象。这个窗口可以通过一定数量的像素,流离失所和下一个分区将开始第一个结束。 |
诉的结论 |
本文的硬件可重构解决方案实现图像恢复。相关问题讨论许多阶段的设计过程,从算法的修改,在整个硬件设计和进一步的技术改善执行时间。硬件解决方案,主要是利用应用程序的并行性,以获得加速对软件实现。关于技术来改善执行时间,之间的相关性迭代图像重建算法的收敛时间与像素值的分布进行了研究。统计分析在多个图像显示像素值的标准差之间存在相关性,该地区恢复和所需的迭代次数。 |
引用 |
|