用matlab 高斯滤波分析视频的时候 Temporal filtering 时间滤波是什么意思 怎么个滤波原理?

热门关键词搜索
Sponsored links
23 篇源代码 21 篇源代码 18 篇源代码 13 篇源代码 9 篇源代码
285 篇源代码 173 篇源代码 48 篇源代码 42 篇源代码 36 篇源代码
登录 CodeForge
还没有CodeForge账号?
Switch to the English version?
^_^"呃 ...
Sorry!这位大神很神秘,未开通博客呢,请浏览一下其他的吧
请按 Ctrl+D 键添加到收藏夹。KalmanFilteringTheoryandPracticeUsingMAT 卡尔曼滤波理论和实践,第三版,经典 值得参考 matlab 238万源代码下载-
&文件名称: KalmanFilteringTheoryandPracticeUsingMATLAB(3ed).r
& & & & &&]
&&所属分类:
&&开发工具: matlab
&&文件大小: 4249 KB
&&上传时间:
&&下载次数: 33
&&提 供 者:
&详细说明:卡尔曼滤波理论和实践,第三版,经典书籍,值得参考-Kalman filtering theory and practice, third edition, classic books, it is also useful
文件列表(点击判断是否您需要的文件,如果是垃圾请在下面评价投诉):
&&Kalman_Filtering+Theory+and+Practice+Using+MATLAB+(3ed).pdf
&[]:很好,推荐下载
&近期下载过的用户:
&相关搜索:
&输入关键字,在本站238万海量源码库中尽情搜索:
&[] - Kalman Filtering and theory using Matlab
&[] - 卡尔曼滤波器的算法C实现
最佳线性滤波理论起源于40年代美国科学家Wiener和前苏联科学家Kолмогоров等人的研究工作,后人统称为维纳滤波理论。从理论上说,维纳滤波的最大缺点是必须用到无限过去的数据,不适用于实时处理。为了克服这一缺点,60年代Kalman把状态空间模型引入滤波理论,并导出
&[] - Kalman Filtering- Theory and Practice Using MATLAB 2008年第三版的随书源码
&[] - 这是第三版的一个成功的教材和专业的参考,对卡尔曼滤波的理论和应用。有组织的使用在高级本科水平和作为第一年,研究生级别当然,这本书包括现实世界的问题在实践中的典型实例,还涵盖了更多的实际问题的执行情况。这个更新版包括了一些新问题和新的章节。
&[] - 最简单的卡尔曼滤波器的设计,可以放心使用,直接在MATLAB中可以运行.带有效果图.
&[] - 这本书提供了坚实的介绍卡尔曼滤波的理论和实践方面的读者。它已经更新了卡尔曼滤波,包括适应非线性滤波,更可靠的平滑方法,并在导航应用程序开发的实施和应用的最新发展。所有的软件是在MATLAB中,提供给读者的机会,发现如何卡尔曼滤波行动,并考虑实际运算需要保持结果的准确性。
&[] - 一维卡尔曼滤波在matlab下的仿真 结合阈值判断剔除杂波干扰
&[] - 关于卡尔曼滤波的好书,详细介绍了卡尔曼滤波的原理以及实现。文档分类:
在线文档经过高度压缩,下载原文更清晰。
淘豆网网友近日为您收集整理了关于视频格式转换算法的研究及FPGA实现——去隔行、帧频转换、分辨率变换的文档,希望对您的工作和学习有所帮助。以下是文档介绍:东南丈学硕士学位论文AbstractAmong today’S broadcasting system mostly are video signals ofinterlaced sampling.With this scanmanner the video bandwidth can be greatly reduced.But it also brings phenomenon ofcrawling,blinking,blur and sawtooth.These defects are shown obviously in sclv.ens oflarge size.To improve the visual effectde—interlacing technology emergesas the times require.At the same time,the low frame rate ofthe videosignal also brings visual defects like til,gling,crawling and blinking.The increasing ofscarming rate willmove these defects intooptically insensitive area ofhigh frequency,thus produce better image qualitysubjectively.Moreover,to suit for different displays and the demand for image resizing,reseating is neededfor originat signaI to change the line and pixel number.Therefore de-interlacing,frame rate conversion andrescaling ale the basic contents ofvideo format transform.11∞emergence ofFPGA is the result ofthe development ofVLSI and EDA.FPGA has high integration,small bulk and can be programmed by riser.It enables designer to puter platform to achieve goalsby inputting,simulating,testing and verifying.By using FPGA,the developing period will be shortenedand the investment will be reduced.Also FPGA Can change product on board into product on chip,thuslower the power consumption,improve the reliabilivy and the design Can be modified online.After some main algorithms for video format conversion are introduced,the paper goes deep into thediscussion ofthe FPGA designing scheme ofde-interlacing,flame rate conversion and rescaling andcorrespondingly provides the pact solution,the solution based on non·linear arithmetic and thesolution based on pensation.The pact solution performs de-interlacing,frame rateconversion and resealing simultaneously wjt量l the least consumption ofFPGA rasources and outer RAMand is the base oflater solutions witch are plex.In the scheme,de-interlacing uses a method bining while frame rate conversion adopts the way offrame repeating and for rescaling,by meansofeveninterpolation.Thesolutionbasedonnon—lineararithmeticaddsthejudgmentofstatic area,usingstored data for static area and the non-linear result ofstored data for motional area.The solution based pensation does motion estimation for interpolatory frame besides thejudgment ofstatic algaand figures oat data ofmotional area with motion vector.The scheme uses user-defined motion estimationmethod offormer end later block matching,finding motion vector paring SAD value with finerealization ofTSSA.Key worda:de-interlacing,flame rate conversion,rescaling,motion estimation,pensation,FPGAⅡ东南大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料.与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。研究生签名:—誊I兰垫2—一日期:2号2坐东南大学学位论文使用授权声明东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权东南大学研究生院办理。研究生签名;逸i堂导师签名:D样÷哺掣第一章概述第一章概述1.1隔行扫描缺陷和去隔行的意义在当今的广播系统中,绝人部分的视频信号是隔行采样的。采用这种扫描格式,能够大幅度地减少视频的带宽,但同时图像的主观质鼙又不会F降太多。这是因为,它巧妙地利用了人眼的一个视觉特性,即:人的视觉系统对图像的小面积闪烁没有对大面积闪烁感觉敏锐。因此,对f两个具有完全相同带宽的视频信号——30Hz逐行与60Hz隔行,人们会明显觉得后者看起来更舒服。电视Jl+播系统中所采用的隔行显示技术给电视广播系统带来了很多的便利。但是同样也给电视系统带来了很多的缺陷,概括起来主要有:爬行:爬行是一种隔行产生的虚像,它出现在没有运动和较少细节的图像中,这和大面积闪烁有点像。当人离显示器比较近的时候,这种现象更明显。因为每条扫描线每帧只更新一次,且单行的亮度衰减较快。人眼有时会盯牢一组扫描线。在每一新场到来时,新的扫描线会出现在旧的扫描线之间,人眼很容易会跳到新的一行上。看起来好像这一组扫描线向上或向下移动了一行到了一个新的位置。连续的整体效果就是一组扫描线很快的向上或向下移动,引起了爬行。人眼一旦盯住了这种爬行的图案,他所看到图像质量就会受到损失。当人离显示器远些时,这种现象会有所缓解,因为人眼对扫描线有个平均的作用。行间闪烁:在英国,有些研究人员将这个称为“颤抖”,指的是屏幕上的物体的水平边缘所造成的闪烁效果,主要和细节和水平边沿有关。一个水平边沿就是图像里一条沿着水平方向的边,比如说一扇门的顶部。产生水平边沿闪烁效果的原冈是摄像机的分解力过高。因为隔行电视的特性,一个精细的水平边沿只能在一场中出现,而在另一场中就消失了。这样,这个精细的水平边沿就相当于以帧频进行显示。例如,奇数场的第3l行是亮的,而紧邻的偶数场的第32行是黑的,则表现为图像中某个物体的边缘第3l行就以30Hz或25Hz的速率在屏幕上闪烁。如果图像里有小的运动的话,边沿会明显的沿着垂直运动的方向闪烁。类似于百叶窗的图像对隔行电视说来是最头疼的。而观众对这些能够觉察到的闪烁会及其厌恶。大面积闪烁:大面积闪烁出现在屏幕的大块区域,比较典型的就是在静止的、细节比较少、亮度比较高的时候出现。大面积闪烁不是因为隔行的原因,主要是由于低的帧频。人在60Hz扫描的逐行图像也同样可以看到大面积闪烁。如果电视图像只是以50或60Hz的频率更新,人的眼睛是可以感受到这种闪烁的。垂直混叠:垂直混叠也与显示屏单行的亮度衰减较快有关,它是对一场只有一半有效行数垂直细节的图像取样的结果,所产生的网纹图案应该和F一场产生的同类图案互补,但人眼和屏幕的组合并朱使两场完全合成整体,其结果是在屏幕上的乖直细节产生混乱。锯齿效应:锯齿效应是隔行电视的另一个普遍现象。这种现象是在静止或运动物体的对角斜边会出现锯齿的形状,当垂直方向相邻的图像像素在前后两场以不同时间出现时就会发生这种畸变。隔行图像的边沿每场只有一半的行数进行更新,这样就导致损失了边沿的细节,一行上的某个像素会比它在前一场中垂直相邻的像素的时间晚。对静止或运动较少的图像,较低的垂直分辨率会引起台阶效应。但如果物体是快速运动的,上面所说的延迟会使得本来相邻的像素发生位移,第二场的这个像素会在第一场垂直相邻像素的右边出现,这时候图像就会显示一连串的阶梯锯盏,使图像的轮廓不够清楚。就是因为这个原因,隔行电视里曲棍球棒看起来会像个拉链。我国的电视机普及率很高,尽管数字梳状滤波器、亮度和色度动态增强电路等数字新技术的出现,在一定程度上提高了电视机的图像质量和性能,但是图像的彩色爬行、画面闪烁和图像快速运动时产生的边缘模糊及锯齿现象并未从根本上得到改善。这些缺陷的罪魁祸首是模拟电视体制的隔行扫描方式。现行三大主要模拟彩色电视系统PAL,NTSC和SECAM均采_I{j这种扫描方式,这种缺陷经大尺寸屏幕放大后就更加明显。为改变画面的视觉效果,去隔行技术(De-interlacing)应运而生。虽然高清晰度电视【11的性能正在不断提高,普及速度正在加快,但是模拟电视并不会马上消失,它在一定时期内仍将在市场上占有一席之地。未来若干年内将是由模拟电视向数字电视转换的过渡期。由于我国各地区经济发展水平不一致,在经济相对落后的地区这个过渡期可能还会比较长。在这个转型时期,由于需要覆盖所有标准,隔行,逐行转换功能对电视产品来说是很重要的功能,模拟电视的隔行扫描到逐行扫描的转换即去隔行是当前视频后处理等电视产品的重要组成部分。因此去隔行技术的研究有着广阔的前景。东南大学硕士学位论文1.2帧频转换的意义场(帧)频是视频格式定义的一个重要方面,一般来说不同的视频格式对应着不同的场(帧)频。当今社会随着个人娱乐和[业应j{;I需求的发展,,“播电视业和视频技术领域发生了翻天覆地的变化,从模拟信号的NTSC,PAL,SECAM到现在全新的全数字电视。先进电视制式和多媒体信息系统的发展导致了图像源码流和显示格式数量的极大增长,相应的就产生了各种各样的视频格式,这些视频格式本身是不能兼容的,因此要保持不同节目源之间的交换通信,就需要有效灵活的算法对这些图像格式在不同标准之间转换。当前国际上流行的几种电视制式有:NTSC每秒30帧(60场)每帧525行,PAL和SECAM每秒25帧(50场)每帧625行,他们的扫描频率各不相同,可以看到在这几种标准下进行节目交换必须进行帧频转化。对于中国大陆和大部分欧洲国家使用的场频为50的PAL制式(这同时也是未来数字电视的传输标准),在高亮度大屏幕显示时会存在许多影响主观观赏效果的问题:比如爬行,行抖动(行间闪烁)以及大面积闪烁.这些都是其格式本身带来的痛疾。不难看出,这些缺陷在描述隔行扫描系统中都已经提到:爬行时由于单行的亮度衰减较快,较少细节区域处的扫描线会像是在移动——提高帧频后亮度衰减的影响将减小,较少细节区域会看上去呈静止状态。行抖动时精细的水平边沿每隔一场显示,表现出以帧频进行闪烁——提高4贞频后精细水平边沿会像是持续显示,抖动将难以察觉。大面积闪烁也直接是由低帧频导致——提高帧频后大面积区域的亮度会变得稳定,闪烁将不明显.可以看到,这些缺陷虽然存在于隔行系统中,却也是由低帧频引起的。增加帧扫描频率会把这些视觉缺陷搬移到人眼不敏感的高频区域上去从而产生较好的主观图象质量。例如将隔行图象变换到逐行图像(即使帧频加倍)可以显著减少抖动和爬行。而在视频格式扫描变换中,除了隔行到逐行的变换达到提高帧频的作用外,还有其他两种方法来解决上述问题:第一种,就是在去隔行以后再进行帧频提升,即把去隔行以后的501-I Z帧频进行提升变换,目前主要有两种变换,分别为50Hz到75Hz的1.5倍变换(通常情况下监视器的工作帧频大约在75赫兹左右),和50Hz到60Hz的1.2倍变换;第二种方法是50Hz隔行到1001-Lz隔行的扫描变换,目前在许多高档电视机中已经得的应用。1.3分辨率变换的意义如果输入图像和需要显示的输出图像的每行像素数或者每帧行数不同,或为了产生画中画(PIP)、多画面模式(MPM)、拉伸(Zooming)等视频特效时,就必须采用分辨率变换技术。将图像放大显示还能够增加观众的临场感。另外随着HDTV。SDTV等各种高端数字电视以及多媒体系统的迅速发展,伴随而来了终端视频显示器的多样化,出现了液晶显示器LCD,等离子显示器PDP等品种繁多的显示终端。分辨率变换便是为了适应不同显示终端对图像大小变化的要求而进行的一类最基本的图像处理。将单一的电视信号显示分辨率灵活地转换成其它格式的分辨率(如800×600,等),可使其在具有相应晟佳分辨率的显示终端全幅输出。在多种平板显示器中,等离子体显示器(Plasma Display Panel,简称PDP)作为大屏幕、高清晰度壁挂电视的主流产品,正以前所未有的速度发展着。越来越多的人把眼光投向了PDP这一超大规模集成电路与尖端工艺技术相结合的新型显示器件。液晶显示器也存在一个最佳分辨率,因为液晶显示器采用数字显示方式,直接把显卡输出的模拟信号处理为带具体地址信息的显示信号,每个像素的亮度和色度信息和屏幕上相麻的像素点对应,所以液晶显示器只有在显示与该液晶显示板的分辨率完全一样的画面时才能达到最佳效果。假如液晶显示器工作在低分辨率F,如800×600时,如果显示器仍然采用像素一一对应的显示方式的话,那就只能把画面缩小居中利用屏幕中心的那800 X600个像素来显示,虽然画面仍然清晰,但是显示区域太小,以o.297mm点距的15英寸液晶显示器为例:在8分辨率下的显示区域为最大即304×228mm,但在800 X600分辨率下如果以缩小居中方式显示,则显示区域仅有237×178mm。显然,这种牺牲显示面积来换取显示质量的显示方式对于价格昂贵的液晶显示板是一种极大的浪费。要在低分辨率下充分利用显示面积,只有对显示信号通过运算处理后,把800×600的画面放大成的画面,再输出到液晶板上全屏显示。在这个复杂的处理过程中,需要对显示画面的内容做出改动,生成新的像素插入到显示画面中。这种改变显示内容的方式必然导致画面的失真,最明显的就是文字笔画的边缘模糊迹象。因此,为了有效降低这种因为分辨率不足而导致的视频信号失真问题,就必然涉及到分辨率的格式转换问题。近些年来,作为视频显示格式转换2第一章概述算法的一个重要方向——视频序列的分辨率格式转换算法研究越来越引起人们的重视。同时传统模拟电视信号必须转换为数字电视支持的数字信号格式才能在数字电视上显示,也需要优良的图像插值技术将低分辨率的I型像经过插值滤波后转为高分辨率幽像1.4 FPGA实现去隔行、帧频转换、分辨率变换成为视频格式转换[21131的基本内容。视频格式转换算法的性能和复杂度取决于戍用场合的性质:消费电子产品要求这种格式转换算法必须容易实现因而也就具有价格优势从而能够批量生产占领低端消费市场:电视台等专业团体需要高端算法以达到高质量的图像质量满足高端需要.而这个时候算法实现复杂度就不再是决定冈素了。因为该算法对系统实时性要求较高,一般的DSP处理器无法满足需要,因此选用FPGAl41器件来实现算法。FPGA(FieldProgrammableGateArray现场可编程门阵列)的出现是VLSI(超大规模集成电路)技术和EDA(Electronic Design Automation电子设计自动化)技术发展的结果。FPGA器件集成度高、逻辑功能强、灵活性大、体积小,具有通过用户编程实现专门应用的功能。它允许电路设计者利用基于计算机的开发平台,经过设计输入、仿真、测试和校验,直到达到预期的结果。使用FPGA器件可以大大缩短系统的研制周期,减少资金投入。更吸引人的是,采用FPGA器件可以将原来的电路板级产品集成芯片级产品,从而降低了功耗,提高了可靠性,同时还可以很方便的对设计进行在线修改。随着FPGA技术的发展,满足专用需求的底层硬件资源越来越丰富。与RAlVl等存储单元相关的资源有三类:查找表(Look-up Table LUT)、触发器(Flip-flop FF)和EAB,这三种资源都可以被综合实现为RAM等存储单元。无论哪家生产商的FPGA,其底层可编程逻辑单元无一例外的都是基于触发器和查找表结构的。这两种基本可编程资源都可以综合并实现为RAM等存储单元。数据少,速度高的存储结构可以用寄存器资源实现;数据相对大一些,时序余量宽松的存储单元可以用LUT实现。EAB的概念源于门阵列的嵌入式功能,目的是为使复杂的功能在尽可能小的硅片上得以实现,需将定制的硅片放在门阵列基片上。EAB即FPGA中内嵌的存储单元,是在输入输出口上带有寄存器的存储块,它可以通过配置和粘合逻辑(Glue Logic)非常方便的实现一些规模不太大的FIFO、ROM、RAM和双端口RAM等功能;还能够用来实现乘法器、矢鼍定标器和错误校上E电路等的功能;除此之外,还可以应用于算术逻辑单元、数字滤波器、微控制器和微处理器等。为了满足SOPC及其它复杂应用,高端FPGA中的内嵌EAB的容量与可配置的端口数量越来越多。目前某些高端器件的EAB的容量超过10Mbit。由于EAB资源是FPGA内嵌的一种独立资源,所以在生产RAM、ROM、CAM等存储单元时,戍尽量首先使用EAB,其原因有二:第一,使用EAB资源,可以节约更多的FF和LuT等底层可编程单元。使用EAB是晟丈程度发挥所选器件效能,节约成本的一种体现;第二,EAB是一种可以配置的硬件结构。其可靠性和速度与用LuT和FF构建的存储器相比更有优势。所以将FPGA应用于视频信号处理时,可以充分发挥其逻辑功能强、执行速度快的优势,较为理想的实现各种算法,为视频格式转换提供解决方案。其可在线修改的特点也方便了后期对程序的优化以及应用场合变更时对方案的调整。3东南丈学硕上学位论文第二章视频格式转换算法综述为了解决去隔行等问题,人们已经研究了很多算法并将其麻用于实际产品中。其中最简单的是线性方法,直到上世纪70年代末,这一直是应用于电视产品的酱遍方法。从80年代早期开始,有些学者提出了比线性方法性能更好的非线性方法。接着,针对场景中运动物体的运动补偿的算法被提出来了,这种算法要做到实时性需要占用大每高速硬件资源,因此当时被认为对于消费类电子来说过于昂贵。随着超大规模集成电路的发展和数字系统设计手段的提高,在90年代早期出现了基于运动补偿的面向消费类电子的芯片,这是个重大的突破。2.1去隔行算法综述去隔行处理的基本原理是根据图像序列在时间和空间的相关性,产生出空缺位置处的像素点。通过这种处理,可以最大限度的恢复出逐行扫描图像,改善电视画面的质量;同时也生成了点阵显示设备可以接受的逐行格式。去隔行的任务就是将隔行扫描的输入场(包括奇场和偶场)转换成帧。这些帧表示与输入相同的图像,但包括所有行的采样。一般的定义输出帧FoⅨn)为一岱鸡 Ymod2--nmod2Fo(X,n);一t-Fi(X,n) 其它(2.1.1)其中】,一xy)为二维空间的位置坐标,n为场序号,F(Xn)为输入场的像素点灰度值,FiⅨn)为插补场的像素点灰度值。去隔行算法主要分为非运动补偿(Non-pensation)和运动补偿(pensation)两大类15II”非运动补偿算法是早期比较简单,且硬件实现比较容易的算法,主要包括线性和非线性两种算法。运动补偿类算法是目前晟先进的去隔行算法,与非运动补偿算法相比,运动补偿算法极大的提高了去隔行运算的准确度,但同时由于加大了硬件实现的难度,这种算法一直停留在理论研究阶段,直到九十年代中期随着vLsI技术的发展和算法的改进,面向普通消费类市场的单芯片运动估计器的出现,运动补偿类的格式转换算法才开始成为研究的热点。下面将分别对非运动补偿算法和运动补偿算法以及运动估计算法做简要介绍。2.1.1非运动补偿的去隔行算法基于非运动补偿的去隔行算法分为两种:线性类算法和非线性类算法。这两种算法中都包括空间(场内)、时间(场间)和时空算法。2.1.1.1 线性滤波去隔行线性滤波算法具有简单易实现的优点,目前仍在一些低端视频格式转换领域内被广泛应用。其基本思想是:各场中需要补齐的像素点等于它的若干相邻点的加权和。用公式表达为:F(墨n) (ymod 2=nmod 2)厂一Fo(墨n产1 &.F(X+kuy,n+m)h(k,m)(otherwise) (2.1.2)o 7化mE{…一l,o’I,…’,(¨n)mod 2=1)其中,x=(x,y)为像素位置,蜥=(0,Ay)为垂直方向上的单位向量,h(k,m)为加权系数。从上式可以看到,线性滤波的相邻点包括两类,即同一场上的相邻像素(空间相邻点)以及相邻场上的像素(时间相邻点)。对于相邻点的分类就引出了三种不同的滤波器类型:空阃滤波(SpmialFiltering),时间滤波(Temporal Filtering),以及时一空滤波(Spatial—Temporal Filtedng)。(1)空同滤波(Spatial Filtering)所谓空间滤波,就是在求取未知点的时候只使用同一场内相邻点的信息。最简单的空间滤波就是扫描线重复(Line Repetition),即一场中未知的像素点直接取它上面相邻点的值。如果用公式(2.1.2)的形式来表示的话,那就是取h(.1,o户l,而其他所有的h(k,m)都为0。一种稍微复杂一点的形式为线平均(LineAveraging),即未知的像素点等于其上下两个相邻已知的点的值的平均。即:h(-l’0产h(1,0户0.5,而其他所有的h(k’m)都为0。上述两个空间滤波有一个共同的特点,即它们在时间频率方向上是全通的,这说明使用空间滤波器不会造成视频运动信息上的损失。但是,由于其频谱在垂直方向上的低通形状,使得视频信号在垂直方向上的一些高频分量被抑制,从而降低了图像在垂直方向上的清晰度。(2)时间滤波(Temporal Filtering)4第二章视频格式转换算法综述与空间滤波正好相反,时间滤波就是利用了待插值点在时间轴上的相关性,使用所有相邻场内的点来求取当前场的未知像素。最简单的时间滤波就是场重复(Field Repetition),即一场中未知的像素点用上一场对应的已知像素值来代替。如果坩公式2.1.2来表示的话,我们取hi0,.1Pl,而其他所有的h(Lm)都为O.{艮显然.如果视频中没有运动的话,这一滤波器就是最优滤波器。时间滤波器在垂直方向上是全通的,因此不会造成图像垂直清晰度上的损失,但其在时间频率上的频谱的衰降,会造成视频运动信息的损失。(3)时空滤波(Spatial-Temporal Filtering)所谓时空滤波,就是在计算像素点的值的时候综合考虑空问邻点与时间邻点,它结合了上述两种滤波算法的特性,利用时间空问三维邻域内的信号相关性来重构待插信号。从理论上说,如果视频信号满足采样定理,即其频谱没有混叠的话,那么使用时空滤波器就能完美地从隔行信号恢复出逐行信号。由于具有较好的处理品质,此类滤波算法在早期的去隔行芯片中得到广泛运用,~个常用的时空滤波器的系数为:r.1,g,8,l(k=-3,-l,l,3)A(m—O)18hCk,m)=_-5,10-5(k---2,0.2)A(m=0)1.0(otherwise) (2.1.3)线性类格式变换算法利用了视频信号在时间.空间频域内带限这一基本假设,算法结构简洁,规则易于芯片实现,处理品质比较稳定。但线性滤波器也存在诸多缺陷,如通带和止带的频率很难选择和所设计的低通滤波器不够理想等。2.1.1.2 非线性算法线性空间滤波类算法会引入图像混叠,而线性时间滤波对于运动场景会引入运动模糊。随着对多种算法的特性和由此引起的图像退化现象的深入理解,人们开始考虑设计能够根据场景内容在不同算法和不同系数间进行自动调整的算法,以综合不同算法的优势。这样在上世纪80年代后期和90年代早期出现了很多非线性类的自适应变换算法。(1)运动自适应算法(Motion-Adaptive Algorithms)在没有运动的情况下,时间滤波器的性能最好。而在有运动,但没有过多的垂直细节的情况下,空间滤波的效果最好,很自然地,我们想到能否将前面已有算法结合起来。根据情况,有选择地使用时间滤波或空间滤波。运动自适应算法就是根据上述思想发展起来的。运动自适应算法需要一个检测图像中是否存在运动的模块,称为运动检测模块(Motion Detector),根据运动检测模块的输出来调整相应的内插策略。为了保证运动检测的有效性,必须假定运动检测算法所必需满足的条件: (I)相对信号来说,噪声必须足够小; (2)信号中的低频部分的能量必须大于噪声与频率混叠部分; (3)视频中的物体大小必须大于像素点的大小。运动检测的算法有许多,详细的情况可以参考文献【7】【8】【9】。当检测出运动的可能性很大时,结果将会倾向于采用运动最优滤波器。反之则会倾向于静止最优滤波器,从而达到了自适应的目的。待插值点公式可表示为:F。(Xn,WFs(X n)4-(1-a)F.0。n) (2.1.4)其中F5(X n)为静止图像部分;Fm‘誓n)为运动图像部分;q为加权系数,由运动检测模块输出的运动等级设定。(2)边缘自适应算法(Edge-Adaptive Algorithms)边缘自适应算法的基本思想是:当视频中存在运动,而必须采用帧内内插算法时,我们就尽量选择一条边,使沿着这条边方向上的内插失真晟少。图2.1.1是这种算法的示意图。图中,x位置代表需要计算的像素,而A,B,C,D,E,F,G,H等则是己知的像素。5东南大学硕士学位论文rl●I.1图2.1.1边缘自适应内插算法示意图边缘自适应算法中,像素x的值定义为:广x^ “IA-FI&]C-DI)A(IA-FlqB·EI))x;1 xB ((IA—FI&IC-DI)A(IA-Fl&|B-EI))Lxc(otherwise) (2.1.5)其中,x^,XB,xc被分别定义为:X^气A+日,2, XB=(B+E)彪,Xc=(C+D)/2 (2.1.6)而A,B,C。D,E,F则是图中相应位置处像素的值。与线性滤波类算法相比,边界自适应滤波器在保留边界信息的同时减少了运算量(--维滤波降为一维滤波),是性价比很高的一类格式变换算法。但作为一种场内算法,场频变换和隔行信源的混叠效应仍无法解决。在所有的菲线性算法中,中值滤波算法因其实现简单而成为最受欢迎的一种算法。它隐含了对边界或运动的自适应,~种简单的三点中值滤波算法如下:广F(墨n), O mod 2--n mod 2)Fo(X,n户.{omed(F(X-Hy,r1),F(X十Ⅳ&n),F(X,n-ID,(otherwise) (2.1.7)其中,中值函数med(A,B,c)定义为:rA, (B&A《C)V(c&A&B)med(A,B,c产1 B,(A&B《)V(c&B&A)UC, (otherwise) (2.1.8)即输出帧的内插行为当前场的上下点和前一场当前点的中值。中值滤波算法实质上包含着运动自适应的思想。这是因为,如果图像区域是静止的,则F(X,n-I)的值很有可能处在当前场上下两个像素点值的中间,此时根据中值函数的定义,ReXn)将直接等于F(X,n-I)。反之,若图像区域存在运动,则前后两场之间的变化会较大,导致F(X,n-I)与处在当前场的(F(xⅢ。n)与F(X&lily,n)相差较远。此时,通过中值函数,最后相当于切换到场平均滤波。我们注意到,中值滤波是一种比较简单有效的方法,在许多情况下有着良好的性能。尽管中值滤波存在引起图像细节变形的缺陷,但是它能较好地保留物体边界信息,且易于硬件实现.2.1.2运动补偿的算法(pensated Algorithms)带运动补偿的去隔行算法是目前为止最先进的算法,其基本原理是通过运动估计(MotionEstimation ME)找出相邻场最匹配的块,计算出运动矢量,在运动轨迹上进行插值来重构帧。采用运动补偿算法还原的图像能很好的保持原图像的垂直清晰度。然而,尽管具有理论上的绝对优势,带运动补偿的技术直到90年代中期才开始被应用到消费类产品中去。这是因为,这一类算法的基础——运动估计,是一个计算量极大的环节,需要消耗大量硬件资源。随着各种快速算法的出现以及芯片规模与制造成本的下降。才使得运动估计技术真正能在消费类产品领域内大量应用。我们暂且假定运动矢量已经由运动估计算法得,并用舭,nHd,Ⅸn),d嘏n))表示,其中,螂;n玳表运动矢量在x.轴方向上的投影,而dy(X,n)表示在y.轴方向上的投影。基本的运动补偿算法有时间反向投影(Temporal Backward Projection TBP)、时间递归(Time.Recursive)、基于GST理论(Generalized Sampling Theory Based)的补偿和自适应递归去隔行(AdaptiveRe,cursive De-interlacing)等。下面对这些算法分别作简要介绍。6H心H,HmM第二章视频格式转换算法综述2.1.2.1 时间域反向投影算法Vol(Temporal Backward Projection)在运动矢量己知的情况下,如果要求当前场中一个未知像素的值,我们只需按照运动矢量将其反向投影到前一场上。如果投影到的位置正好是一个已知点或非常接近已知点时,我们就取这个点作为朱知点的值。很明显,我们会发现存在这样一个问题,即:在有些情况F,投影剑前一场的位置处在两个己知点中间。对这种情况,若是根据这两个已知点进行插值显然不行,因为视频信号不满足奈奎斯特条件。因此采样定理不能适用。WoodsItO]等提出了一种解决方法,即在第一次投影位置处在两个已知点中间的情况下,沿着运动矢量继续向前投影一场。经过两场投影,投影点落在己知点附近的概率比单单一场投影提高了许多。当然,经过两场投影仍处于已知点之间的情况也存在,还有由于隔行图像的采样结构,可能有很多待插点永远也得不到相应的己存在点,这时候就只能用场内的边缘自适应算法或者其他方法求得未知点了。时间域反向投影算法(TBP)的计算公式为:r F(Xn)tymod2=nmod 2)FdX,Il户一l F(X-d(X,n)-e,n-1)(O-dy-£y)mod 2=(n-1)mod 2)1 F(X-2d(X,n)-2t,n-2) (O一2dy-2£y)mod 2=n mod 2)L F(X-d(X,n),n-1)(otherwise)(2-i-9)其中,o=(O,曲是一个很小的误差修正矢量。当然,我们也可以继续沿着运动轨迹投影到前面第三场。但实际上,由于时间跨度太大。我们这时候已经不能再把运动矢量看成固定不变的了,因此这种做法不可取。对于时间域反向投影法,其基本的假设是在相邻两场的时间内运动矢量是一致的,但是实际情况中往往不能满足这个条件,因此这种方法的可靠性就大打折扣。在去隔行应用中常与运动矢量精度相结合,采用整点或半像素点运动估计,这样可以在一到两场内找到反向投影点,完成运动补偿。2.1.2.2 时间递归(TR)算法(Time-Recursive De—interlacing)时间递归算法(TR)的基本思想也是反向投影。不过,未知点反向投影到的是前面已经过处理所得到的逐行帧。这一点十分关键,因为逐行帧在垂直方向上的采样率增加了一倍,因此往往满足采样定理。这时候如果再发生投影点处于两个己知点中间的情况,我们只需要进行帧内内插就可以了。如果用公式表示,则时间递归算法的计算方法为:广FⅨn)。 Omod 2;nmod 2)雕,n产1LFo(X-d(X,n),11-1),(otherwise)(2q·10)从上式可以看出,最后内插得到的输出不仅取决于以前原来的像素值,而且也取决于以前内插得到的像素值,因此原来输出的误差不可避免的就传播到接下来的输出结果,这种错误传播是递归算法本身的内在缺陷。为了防止这样的错误传播,一种可行的改进是中值修正方案:输出值在前一帧的补偿值和当前帧的邻域内取中值,当时域的误差累积超过一定范围后将自动由帧内点修正。但方案在阻止误差扩散的同时会引入了混叠效应。关于时间递归算法的详细资料可以参考文献【11】。时间递归算法的运动估计是在当前场和前一去隔行的帧之间进行的。其局限性表现在:①由于运动矢量的不精确和插值效应而导致的错误和噪声的扩散;②一般的摄像机没有光学滤波器消除混叠,因此一幅经过完美去隔行的图像仍然有可能在垂直频域上有混叠。2.1.2.3 基于广义采样定理GST的去隔行算法(De-interlacing based on generalized samplingtheory)由奈奎斯特采样定律知,任何频谱限带于1厂r的信号理论上只要采样率大于2/T,就可以由采样信号完全恢复。实际上,这只是个充分不必要条件。Yenll日提出GST理论:限带于l,r的信号可以由N个采样率为2/NT相位错开的独立采样序列重构。以l“t)表示限带于l,r的待采样的信号,Yl为采样位置为nn-Tl的采样信号:yI(t卜).:lI(nT+TI)5(t-nT-T0 (2一l-11)其频谱则为Yt”孑1互ee e制~m2帅(2-1.12)当频带限于1.rr而采样率为1/T时,在同一时刻对任意的频率只有两个原始的频谱叠加。这就意味着当采样相位已知时,得到的频谱在(o,l门r)上为原来的两个原始频谱的线性复数加权叠加。另一个用不同的采样相位T2采样得到的序列y2则会是另外一种加权线性叠加。因此通过解两个线性7东南大学硕士学位论文方程可以恢复原来的输入模拟信号在(o,l们上的频谱。同样可以适用于(一t厂r,0)范围内。因此我们可以完全恢复原来的输入信号。在这里我们直接给出结论,详细的情况可以参考文献【12】。原始信号可以通过两种不同采样相位的取样信号而恢复:坼产≥.yl(klT+TD sin[x(t·kiT-T2)/T]sinc[n(t-kiT-T1)厂T1/sin[Ⅱ(Tl-T2)仞t:=二一&.y2(klT+T2)sin[z(t-k2T-Tl川sinc[“(t-k2T-T2)/T]/sin[“(Tt_T2用(2-1一13)I;::公式显示GST的方法只使用了原始的采样值,面未使用滤波输出值。与递归类方法相比,没有误差传播问题。与传统的频域线性滤波器相似。2.1.2.4 自适应递归(AR)去隔行(Adaptive Recursive De—interlacing)递归去隔行算法的主要不足就是在输出信号中仍然存在混叠。我们可以把这种混叠理解为在运动轨迹上的非静止状态。G.de haan等11”因此提出了下面的方法对他们加以改进。这种非静止状态可以由一个基于运动}}偿的时间递归滤波器来有效的减小:r kl(墨n)F疋Xn)H1-kl(X,n))Fo(X-d,n-1) O mod 2=n mod 2)哪:n产.{L K2(X,n)FI(X,nHl一k2(X,n))F,,(X-d,n—1)(otherwise)(2-H4)其中Fi陇n)是用其他任意的去隔行算法得到的逐行输出,例如简单的两行平均。kI,k2最好不同。定义以下变量:D预Xn产lto(X-dⅨ∞'lI·1)-F‘Xn)I(2-t-t5)以及函数:r 0,(删)c/积o,1,吣=_{l,(n&1)(2-l-16)L A(otherwise)则kI可以定义如下;k1=clip(O,1,√D矽) (2-l一17)假设可以调整k2使得对于垂直相邻的像素来说沿运动轨迹的差别是一样的。这个假设可以推出以下结论:l F,,(X,n)-Fo(X-d,n-1)J=I Fo(X-uy,n)-F。(X-ufd,n-1)J (2-i·18)因此定义:k2(X,n产堂堂等糟糕嵩器篙型(2-I-19)其中6是为了防止分母为0。公式2-1—18的假设可以推出对插值行像素的时间递归滤波的自适应调整。当k,固定为l时即对原来的像素行不进行滤波。关于算法的详细情况请参看文献D3]。2.1.3运动估计运动估计是运动补偿算法的基础,要用运动补偿滤波来进行视频格式转换,必须要进行运动估计从而得到格式转换所需要的运动矢量。运动估计的方法很多,但是我们必须看到格式转换中对运动估计的要求和视频压缩中是不一样的114J:在视频编码领域,运动矢量是为了减小预测误差(而这个误差还通过信道传送),运动估计的真实性(与真实运动场相比)要求并不高,而运动场的熵却是一个重要的指标,它将决定运动矢量最终编码的比特数,估算的误差由误差帧得以补偿;在格式转换领域,要求:(1)由于内插是在沿着运动轨迹的方向上进行,所以得到的运动矢量必须准确,即能够反映物体的真实运动。这是一个非常关键的要求:使用不能反应物体真实运动的矢量会导致物体位置的偏移,反映到最后效果上就会出现赝像。(2)由于我们设计算法的最终目标是将其制成芯片,供专业设备或消费类电子产品使用,所采用的算法应该尽可能地简化,降低计算复杂度,便于硬件实现。传统压缩编码领域广泛使用的运动估计算法主要考虑的不是其估计结果对实际运动描述的真实性,而是最小化重构残差以达到压缩信息量的目的,因而未采取足够措施来控制上述不适定问题,其结果很难满足空域一致性和时域连续性的要求,并不适合运动补偿格式变换的要求,需要开发更适合的运动估计算法。用于格式转换的运动估计算法可以用于编码,但是用于预测编码的运动估计算法不能照搬到格式转换。S播放器加载中,请稍候...
该用户其他文档
下载所得到的文件列表视频格式转换算法的研究及FPGA实现——去隔行、帧频转换、分辨率变换.pdf
文档介绍:
东南丈学硕士学位论文AbstractAmong today’S broadcasting system mostly are video signals ofinterlaced sampling.With this scanmanner the video bandwidth can be greatly reduced.But it also brings phenomenon ofcrawling,blinking,blur and sawtooth.These defects are shown obviously in sclv.ens oflarge size...
内容来自淘豆网转载请标明出处.

我要回帖

更多关于 matlab 高斯滤波 的文章

 

随机推荐