語音編碼技術始終是語音研究的熱點。語音編碼作為多媒體通信中信息傳輸的一個重要環節,越來越受到廣泛的重視。G729是由美國、法國、日本和加拿大的幾家著名國際電信實體聯合開發的,國際電信聯盟(ITU-T)于1995年11月正式通過了G729。96年ITU-T又制定了G729的簡化方案G729A,主要降低了計算的復雜度以便于實時實現。因其具有良好的合成語音質量、適中的復雜度、較低的時延等優點,G729A標準已被廣泛應用在VOIP網關、IP電話中。 論文利用Altera公司的新一代可編程邏輯器件在數字信號處理領域的優勢,對G729A語音編碼中的線性預測(LP)濾波器系數提取的FPGA(現場可編程門陣列,Field Programmable Gate Array)實現進行了深入研究。論文首先對語音信號處理及其發展進行介紹,深入討論了G729A語音編解碼技術。第二,對Altera公司的Stratix系列可編程器件的內部結構進行了研究,分析了在QuartusII開發平臺上進行FPGA設計的流程。第三,基于FPGA,對G729A編碼系統的LP分析部分做了具體設計,其中包括自相關函數和杜賓(Durbin)遞推兩個主要功能模塊,并對其工作過程進行了詳細的分析。第四,針對系統所使用的除法運算都是商小于1的特點,設計并實現了一個系統專用的除法器模塊。最后,在Altera FPGA目標芯片EP1S30F780C7上,對LP分析系統進行了驗證,證明了方案的可行性。
上傳時間: 2013-06-20
上傳用戶:pwcsoft
視頻監控一直是人們關注的應用技術熱點之一,它以其直觀、方便、信息內容豐富而被廣泛用于在電視臺、銀行、商場等場合。在視頻圖像監控系統中,經常需要對多路視頻信號進行實時監控,如果每一路視頻信號都占用一個監視器屏幕,則會大大增加系統成本。視頻圖像畫面分割器主要功能是完成多路視頻信號合成一路在監視器顯示,是視頻監控系統的核心部分。 傳統的基于分立數字邏輯電路甚至DSP芯片設計的畫面分割器的體積較大且成本較高。為此,本文介紹了一種基于FPGA技術的視頻圖像畫面分割器的設計與實現。 本文對視頻圖像畫面分割技術進行了分析,完成了基于ITU-RBT.656視頻數據格式的畫面分割方法設計;系統采用Xilinx公司的FPGA作為核心控制器,設計了視頻圖像畫面分割器的硬件電路,該電路在FPGA中,將數字電路集成在一起,電路結構簡潔,具有較好的穩定性和靈活性;在硬件電路平臺基礎上,以四路視頻圖像分割為例,完成了I2C總線接口模塊,異步FIFO模塊,有效視頻圖像數據提取模塊,圖像存儲控制模塊和圖像合成模塊的設計,首先,由攝像頭采集四路模擬視頻信號,經視頻解碼芯片轉換為數字視頻圖像信號后送入異步FIFO緩沖。然后,根據畫面分割需要進行視頻圖像數據抽取,并將抽取的視頻圖像數據按照一定的規則存儲到圖像存儲器。最后,按照數字視頻圖像的數據格式,將四路視頻圖像合成一路編碼輸出,實現了四路視頻圖像分割的功能。從而驗證了電路設計和分割方法的正確性。 本文通過由FPGA實現多路視頻圖像的采集、存儲和合成等邏輯控制功能,I2C總線對兩片視頻解碼器進行動態配置等方法,實現四路視頻圖像的輪流采集、存儲和圖像的合成,提高了系統集成度,并可根據系統需要修改設計和進一步擴展功能,同時提高了系統的靈活性。
上傳時間: 2013-04-24
上傳用戶:gundan
H.264/AVC是由ITU和ISO兩大組織聯合組成的JVT共同制定的一項新的視頻壓縮技術標準,在較低帶寬上提供高質量的圖像傳輸是H.264/AVC的應用亮點。在同樣的視覺質量前提下,H.264/AVC比H.263和MPEG-4節約了50%的碼率。但H.264獲得優越性能的代價是計算復雜度的增加,據估計其編碼的計算復雜度大約為H.263的3倍,因此很難應用于實時視頻處理領域。針對這一現狀,業內做了大量的研究工作,力圖降低其計算復雜度和提高運行效率。比如在運動估計方面,國內外在這方面的研究已經很成熟。而針對幀內/幀間預測編碼的研究卻較少。因此研究預測模式的快速算法具有理論意義和應用價值。 本文在詳細研究H.264標準視頻壓縮編碼特點基礎上,分析了H.264幀內編碼, 幀間編碼及變換,量化技術的原理及特點,提出了一種基于局部邊緣方向信息的快速幀內模式判決算法,通過結合SAD的模式選擇方法來減少模式選擇數目。它采用了Sobel梯度算子計算當前塊的邊緣信息,累加當前塊中屬于同一方向像素點的邊緣矢量構造不同模式下的邊緣方向直方圖,以便確定最可能的預測模式。該算法有效降低了編碼器的運算復雜度,在并未顯著降低編碼性能的情況下提升了編碼器效率。仿真表明:Foreman 圖像序列編碼性能有了提高,其中PSNR平均降低了0.06dB,Bitrate平均降低了19.4%,這大大提高了視頻傳輸的質量。 另外在幀間預測模式選擇算法方面進行了改進研究:按順序對不同類型進行判決,有選擇地去比較可能模式,使得在有效減少需判決的模式數量的同時,結合小塊模式搜索中途停止準則來確定最優模式。仿真表明:改進算法相對與原來算法能夠節省很多的編碼時間(平均下降了49.3%),但帶來的圖像質星的下降(平均下降0.08dB,可以忽略)和碼率較少的增加。 同時在整數DCT變換模塊中,提出了一種快速蝶形算法,使得對4×4點數據做一次變換,只需通過8×8次加法和2×8次移位運算便可完成,與原來12×8次加法和4×8次移位相比,新算法大大降低了運算復雜度。 最后介紹FPGA的特點及設計流程,并實現了H.264編解碼器中變換編碼及量化和熵解碼模塊的硬件。這種基于FPGA所實現的H.264編碼視頻處理模塊設計具備了成本低,周期短,設計方法靈活等優點,具有廣闊的市場應用前景。 仿真表明,通過使用本文提出的幀內/幀間速算法方法可使得H.264編碼速度獲得顯著的提高,使H.264 Baseline編碼器能在PC平臺上實現實時編碼。
上傳時間: 2013-07-18
上傳用戶:zukfu
隨著數字電視日益深入人心,高清概念越來越為人所熟知。帶有高清視頻功能的產品已經逐步走向人們的工作和生活,高清視頻處理已經從理論研究走向系統實際應用。毫無疑問,無論是從觀眾的視覺還是從產業的角度來看,高清視頻已經成為數字視頻技術發展的必然趨勢。本文研究了整個編解碼系統中ARM控制模塊的軟件設計,最終完成以PC機為終端控制平臺,經ARM控制模塊將命令發送給核心編解碼芯片MB86H51,使其完成相應的操作。、本文主要的工作有如下幾個方面: 1、根據ARM各型號芯片的特點,結合本系統的實際需求,最終選定Atmel公司的AT91SAM9261作為ARM控制板的核心處理芯片,并深入了解該芯片的工作原理和內部結構。 2、根據本系統中所選用的DataFlash型號及外圍電路連接情況等諸多因素,并結合Atmel公司所提供的AT91SAM9261一級BootLoader參考代碼,編寫調試符合本系統啟動運行的一級BootLoader引導程序,也稱為Bootstrap引導程序,最終成功實現引導U-Boot程序。 3、深入分析了U-Boot和Linux的體系結構和編譯過程,結合AT91SAM9261芯片的特點和實際外圍電路的連接情況,修改U-Boot和Linux中主要的編譯參數,并進行重新編譯,最終成功移植到系統板中。 4、在ITU-T提供的H.264標準的參考解碼程序JM8.6的基礎上,詳細研究了H.264視頻編碼標準以及具體的解碼器結構和解碼流程,并結合DirectX技術,開發了一款基于PC機的H.264解碼播放器,用于驗證存儲在PC機上的H.264壓縮碼流的正確性。
上傳時間: 2013-04-24
上傳用戶:acon
JPEG2000是由ISO/ITU-T組織下的IEC JTC1/SC29/WG1小組制定的下一代靜止圖像壓縮標準.與JPEG(Joint Photographic Experts Group)相比,JPEG2000能夠提供更好的數據壓縮比,并且提供了一些JPEG所不具有的功能[1].JPEG2000具有的多種特性使得它具有廣泛的應用前景.但是,JPEG2000是一個復雜編碼系統,目前為止的軟件實現方案的執行時間和所需的存儲量較大,若想將JPEG2000應用于實際中,有著較大的困難,而用硬件電路實現JPEG2000或者其中的某些模塊,必然能夠減少JPEG200的執行時間,因而具有重要的意義.本文首先簡單介紹了JPEG2000這一新的靜止圖像壓縮標準,然后對算術編碼的原理及實現算法進行了深入的研究,并重點探討了JPEG2000中算術編碼的硬件實現問題,給出了一種硬件最優化的算術編碼實現方案.最后使用硬件描述語言(Very High Speed Integrated Circuit Hardware Description Language,VHDL)在寄存器傳輸級(Register Transfer Level,RTL描述了該硬件最優化的算術編碼實現方案,并以Altera 20K200E FPGA為基礎,在Active-HDL環境中進行了功能仿真,在Quartus Ⅱ集成開發環境下完成了綜合以及后仿真,綜合得到的最高工作時鐘頻率達45.81MHz.在相同的輸入條件下,輸出結果表明,本文設計的硬件算術編碼器與實現JPEG2000的軟件:Jasper[2]中的算術編碼模塊相比,處理時間縮短了30﹪左右.因而本文的研究對于JPEG2000應用于數字監控系統等實際應用有著重要的意義.
上傳時間: 2013-05-16
上傳用戶:671145514
JPEG2000是由ISO/ITU-T組織下的IECJTC1/SC29/WG1小組制定的下一代靜止圖像壓縮標準,其優良的壓縮特性使得它將具有廣泛的應用領域。JPEG2000算法非常復雜,圖像編碼過程占用了大量的處理器時間開銷和內存開銷,因而通過對JPEG2000算法進行優化并采用硬件電路來實現JPEG2000標準的部分或全部內容,對加快編碼速度從而擴展其應用領域有重要的意義。 本文的研究主要包括兩方面的內容,其一是JPEG2000算術編碼器算法的研究與硬件設計,其二是JPEG2000碼率控制算法的研究與優化算法的設計。在研究算術編碼器過程中,首先研究了JPEG2000中基于上下文的MQ算術編碼器的編碼原理和編碼流程,之后采用有限狀態機和二級流水線技術,并在不影響關鍵路徑的情況下通過對算術編碼步驟優化采用硬件描述語言對算術編碼器進行了設計,并通過了功能仿真與綜合。實驗證明該設計不但編碼速度快,而且流水線短,硬件設計的復雜度低且易于控制。 在研究碼率控制算法過程中,首先結合率失真理論建立了算法的數學模型,并驗證了該算法的有效性,之后深入分析了該數學模型的實現流程,找出影響算法效率的關鍵路徑。在對算法優化時采用黃金分割點算法代替原來的二分查找法,并使用了碼塊R-D斜率最值記憶和碼率誤差控制算法。實驗證明,采用優化算法在增加少量系統資源的情況下使得計算效率提高了60%以上。之后,分析了率失真理論與JPEG2000中PCRD-opt算法的具體實現,又提出了一種失真更低的比特分配方案,即按照“失真/碼長”值從大到小通道編碼順序進行編碼,通過對該算法的仿真驗證,得出在固定碼率條件下新算法將產生更少的失真。
上傳時間: 2013-07-13
上傳用戶:long14578
ISO和ITU-T制定的一系列視頻編碼國際標準的推出,開創了視頻通信和存儲應用的新紀元。從H.261視頻編碼建議,到H.262/3、MPEG-1/2/4等都有一個共同的不斷追求的目標,即在盡可能低的碼率(或存儲容量)下獲得盡可能好的圖像質量。 本課題的研究建立在目前主流的壓縮算法的基礎上,綜合出各種標準中實現途徑的共性和優勢,將算法的主體移植于FPGA(FieldProgrammableGateArray)平臺上。憑借該種類嵌入式系統配置靈活、資源豐富的特點,建立一個可重構的內核處理模塊。進一步的完善算法(運算速度、精度)和外圍系統后,就可作為專用視頻壓縮編碼器進行門級電路設計的原型,構建一個片上可編程的獨立系統。 編碼器設計有良好的應用前景,通過使用離散余弦變換和熵編碼,對運動圖像從空間上進行壓縮編碼,使得編碼后的數據流適合于傳輸、通信、存儲和編輯等方面的要求。同時,系統的設計將解碼的工作量大幅度降低,功能模塊在作適當的改動后可為解碼器的參考設計使用。 研究所涉及的各功能模塊都進行了系統性的仿真和綜合,滿足工程樣機的前期研發需要。
上傳時間: 2013-04-24
上傳用戶:xiangwuy
數字信息在有噪聲的信道中傳輸時,受到噪聲的影響,誤碼總是不可避免的。根據香農信息理論,只要使Es/N0足夠大,就可以達到任意小的誤碼率。采用差錯控制編碼,即信道編碼技術,可以在一定的Es/N0條件下有效地降低誤碼率。按照對信息元處理方式不同,信道編碼分為分組碼與卷積碼兩類。卷積碼的k0和n0較小,實現最佳譯碼與準最佳譯碼更加容易。卷積碼運用廣泛,被ITU選入第三代移動通信系統,作為包括WCDMA,CDMA2000和TD-SCDMA在內的信道編碼的標準方案。 本文研究了CDMA2000業務通道中的幀結構,對CDMA2000系統中的卷積碼特性及維特比譯碼的性能限進行了分析,并基于MATLAB平臺做了相應的譯碼性能仿真。我們設計了一種可用于CDMA2000通信系統的通用、高速維特比譯碼器。該譯碼器在設計上具有以下創新之處:(1)采用通用碼表結構,支持可變碼率;幀控制模塊和頻率控制器模塊的設計中采用計數器、定時器等器件實現了可變幀長、可變數據速率的數據幀處理方式。(2)結合流水線結構思想,利用四個ACS模塊并行運行,加快數據處理速度;在ACS模塊中,將路徑度量值存貯器的存儲結構進行優化,防止數據讀寫的阻塞,縮短存儲器讀寫時間,使譯碼器的處理速度更快。(3)為了防止路徑度量值和幸存路徑長度的溢出,提出了保護處理策略。我們還將設計結果在APEXEP20K30E芯片上進行了硬件實現。該譯碼器芯片具有可變的碼率和幀長處理能力,可以運行于40MHZ系統時鐘下,內部最高譯碼速度可達625kbps。本文所提出的維特比譯碼器硬件結構具有很強的通用性和高速性,可以方便地應用于CDMA2000移動通信系統。
上傳時間: 2013-06-24
上傳用戶:lingduhanya
語音編碼技術始終是語音研究的熱點。語音編碼作為多媒體通信中信息傳輸的一個重要環節,越來越受到廣泛的重視。G729是由美國、法國、日本和加拿大的幾家著名國際電信實體聯合開發的,國際電信聯盟(ITU-T)于1995年11月正式通過了G729。96年ITU-T又制定了G729的簡化方案G729A,主要降低了計算的復雜度以便于實時實現。因其具有良好的合成語音質量、適中的復雜度、較低的時延等優點,G729A標準已被廣泛應用在VOIP網關、IP電話中。 論文利用Altera公司的新一代可編程邏輯器件在數字信號處理領域的優勢,對G729A語音編碼中的線性預測(LP)濾波器系數提取的FPGA(現場可編程門陣列,Field Programmable Gate Array)實現進行了深入研究。論文首先對語音信號處理及其發展進行介紹,深入討論了G729A語音編解碼技術。第二,對Altera公司的Stratix系列可編程器件的內部結構進行了研究,分析了在QuartusII開發平臺上進行FPGA設計的流程。第三,基于FPGA,對G729A編碼系統的LP分析部分做了具體設計,其中包括自相關函數和杜賓(Durbin)遞推兩個主要功能模塊,并對其工作過程進行了詳細的分析。第四,針對系統所使用的除法運算都是商小于1的特點,設計并實現了一個系統專用的除法器模塊。最后,在Altera FPGA目標芯片EP1S30F780C7上,對LP分析系統進行了驗證,證明了方案的可行性。
上傳時間: 2013-04-24
上傳用戶:miaochun888
H.264/AVC是ITU與ISO/IEC(International Standard Organization/Intemational Electrotechnical Commission國際標準化組織/國際電工委員會)聯合推出的活動圖像編碼標準。作為最新的國際視頻編碼標準,H.264/AVC與MPEG-4、H.263等視頻編碼標準相比,性能有了很大提高,并已在流媒體、數字電視、電話會議、視頻存儲等諸多領域得到廣泛的應用。基于上下文的自適應二進制算術編碼(Conrext-based Adaptive Binary Arithmetic Coding,CABAC)是H.264/AVC的兩個熵編碼方案之一,相對于另一熵編碼方案-CAVLC(基于上下文的自適應可變長編碼),CABAC具有更高的數據壓縮率:在同等編碼質量下要比CAVLC提高10%~15%的壓縮率。CABAC能實現很高的數據壓縮率,但這是以增加實現的復雜性為代價的。在已有的硬件實現方法上,CABAC的解碼效率并不高。 論文在深入研究CABAC解碼算法及其實現流程,并在仔細分析了H.264/AVC碼流結構的基礎上,總結出了影響CABAC解碼效率的各個環節,并以此為出發點,對CABAC解碼所需中的各個功能模塊進行了優化設計,設計出一種新的CABAC解碼器結構,相對于一般的CABAC解碼器,它的解碼效率得到了顯著提高。論文針對影響CABAC解碼過程的"瓶頸"問題一多次訪問存儲部件影響解碼速率,提出了新的存儲組織方式,并根據CABAC的碼流結構特性,采用4個子解碼器級聯的方式來進一步提高解碼速率。 最后,用Verilog語言對所設計的CABAC解碼器進行了描述,用EDA軟件對其進行了仿真,并在FPGA上驗證了其功能,結果顯示,該CABAC解碼器結構顯著提高了解碼效率,能夠滿足高檔次實時通訊的要求。
上傳時間: 2013-07-03
上傳用戶:huazi