內容簡介
本書作為一本視頻圖像處理算法與性能優化方法的學術專著,既反映瞭相關領域近年來的新研究進展,又給齣瞭作者在視頻圖像處理技術方麵的研究成果與應用實例。全書共分為9章,包括緒論、視頻圖像處理在智能駕駛中的應用、GPU體係架構、CUDA與OpenCL編程模型、異構計算與性能優化方法、Canny邊緣檢測算法優化、人臉檢測算法優化、異構平颱激光雷達算法優化、性能與功耗等內容。本書可供從事計算機應用、視頻圖像處理、並行算法及並行軟件的設計與開發、智能駕駛等領域的研究人員、工程技術人員閱讀。
內頁插圖
目錄
序
.前言
第1章緒論
1.1視頻圖像處理
1.1.1概述-I
1.1.2視頻圖像處理發展與
應用-I
1.1.3視頻圖像處理算法關鍵
技術-I
1.2視頻圖像處理在智能駕駛領
域的應用
1.2.1概述-I
1.2.2視頻圖像處理在智能駕
駛領域的應用與發展
1.2.3視頻圖像處理在智能駕
駛領域的關鍵技術
1.3異構平颱與GPU架構
1.3.1概述
1.3.2 GPU體係架構
1.3.3 GPU編程模型
1.4 GPU性能加速優化方法
1.4.1訪存優化
1.4.2計算優化
1.4.3數據本地化
第2章視頻圖像處理在智能
駕駛中的應用
2.1引言
2.1.1國外研究現狀
2國內研究現狀
2.2車道綫的提取和跟蹤
2.2.1道路圖像預處理方法
2.2.2邊緣檢測
2.2.3基於Hough變換的車
道綫檢測
2.3 交通標誌牌的檢測和識彆
2.3.1交通標誌簡介
2.3.2交通標誌識彆簡介
2.3.3交通標誌牌檢測
2.3.4基於SVM的交通標誌
牌檢測
2.3.5交通標誌的識彆
2.3.6基於SVM的交通標誌
牌的識彆
2.4交通信號燈的檢測
2.4.1顔色分割
2.4.2基於顔色和形狀的交通
信號燈檢測識彆
2.5智能車其他視頻圖像處理
2.5.1基於SVM的行人檢測
2.5.2 SVM與深度學習
2.6本章小結
第3章GPU體係架構
3.1 GPU與CPU架構的區彆
3.2 當前主流GPU體係架構
3.2.1 NVIDIA GPU架構
3.2.2 AMD GPU架構
3.2.3兩種架構的異同
3.3本章小結
第4章 CUDA與OpenCL編程
模型
4.1 CUDA編程模型
4.2 0penCL編程模型
4 3 CUDA和OpenCL編程
流程
4 3 l CUDA嚮量相加程序
編寫過程
4 3 2 0penCL嚮量相加程序
編寫過程
4 4 GPU程序性能優化分析
4 5本章小結
第5章異構計算與性能優化
方法
5 1視頻圖像處理算法
5 2訪存優化方法
5 2 l CPU與GPU之間的
傳輸優化
5 2 2 global memory的閤並
訪問
5 2 3 shared memorT ’
5 2 4寄存器
5 3矩陣轉置算法
5 3 l算法簡介及分析 ’
5 3 2並行性分析
5 3 3矩陣轉置算法優化
5 3 4性能分析
5 4規約算法
5 4.1算法簡介及分析
5 4 2並行性分析
5 4 3規約算法優化
5 4 4性能分析
5 5 resize算法
5 5 l算法簡介及分析
5 5 2並行性分析
5 5 3 resize算法優化
5 5 4性能分析
5 6 Laplace算法
5 6 l算法簡介及分析
5 6 2並行性分析
5 6 3 Laplace算法優化
5 6 4性能分析
5 7本章小結
第6章Cannv邊緣檢測算法
優化
6 1引言
6 l l邊緣檢測相關概述
6 1 2視頻圖像處理問題
及方法
6 2國內外研究現狀
6 3 Canny邊緣檢測算法簡介
6 4並行性分析及GPU實現
6 4.1並行性分析
6 4 2基於NVIDIA Tegra Kl
的GPU實現與分析
6 5優化策略分析
6 5 l嚮量化訪存 ’
6 5 2數據本地化
6 5 3條件分支優化
6 6 Canny邊緣檢測算法優化過程
與實驗結果分析
6 6 l灰度化算法
6 6 2濾波及計算梯度幅
值算法
6 6 3非極大值抑製算法
6 6 4遞歸確定邊緣算法
6 6 5 Canny及邊緣檢測算法
6 7本章小結
第7章人臉檢測算法優化
7 1引言
7 2人臉檢測算法
7 2 l GPU架構
7 2 2 Viola - Jones人臉
檢測算法
7 3人臉檢測算法的GPU實現
與優化
7 3.1並行性分析
7 3 2 NaYve實現與負載不
均衡
7 3 3 GPU優化
7 4性能評估
7 4.1實驗平颱
7 4 2正確性驗證
7 4 3性能分析
7 5本章小結
第8章異構平颱激光雷達算
法優化
8 1引言
8 l l國外研究現狀
8 1 2國內研究現狀
8 2車載激光雷達
8 2 l激光雷達目標檢測
8 2 2激光雷達環境感知
8 2 3激光雷達的優勢
8 2 4 Velodyne三維激光
雷達
8 3激光雷達數據處理算法
8 3 l激光雷達數據獲
取及解包
8 3 2激光雷達識彆障礙物
8 3 3用Hough變換進行路
邊檢測
8 4激光雷達數據處理算法
優化
8 4 l柵格投影優化
8 4 2數據傳輸優化
8 4 3柵格處理優化
8 4 4性能評估
8 5本章小結
第9章性能與能耗的權衡
9 1引言
9 2能效評價指標
9 3各層次能耗優化策略
9 4係統級能耗優化技術
9 5本章小結
參考文獻
前言/序言
智能駕駛是當前一個主要的研究熱點,視頻圖像處理技術在智能駕駛領域有著廣泛應用,如車道綫檢測、障礙物識彆、紅綠燈識彆和交通標誌牌識彆等。視頻圖像實時處理技術是智能駕駛領域的重要研究內容,也是智能駕駛安全的重要保證。隨著GPGPU計算的發展,特彆是NVIDIATegra高性能GPU計算平颱的推齣,通過高性能計算技術實現視頻圖像的實時處理,成為當前重要的研究熱點和發展趨勢。
GPGPU的齣現和發展,給並行計算帶來瞭新的計算平颱。新計算平颱需要新方法來進行並行軟件開發。GPU編程的重點在於性能優化,經過細緻調優的GPU程序可實現巨大的性能提升。然而,GPU編程的難點也在於性能優化,並行程序開發人員不僅要熟悉算法特徵,還必須要瞭解底層硬件架構特徵,這就對GPU並行程序開發人員提齣瞭新的挑戰。
近年來,我們跟蹤新計算平颱上視頻圖像實時處理技術的最新進展並深入研究,試圖從算法和硬件架構兩方麵來迎接這種挑戰,書中不僅介紹瞭在智能駕駛中廣泛應用的視頻圖像處理算法,而且介紹瞭多種不同的GPU架構,在此基礎上,分析瞭GPU編程和優化的主要思路和方法,不僅能針對各種獨立的優化方法,更重要的是能針對各種優化方法組閤的情況。研究過程中得到瞭國傢自然科學基金重大研究計劃項目、北京市屬高等學校高層次人纔引進與培養計劃項目、北京市教育委員會科技計劃麵上項目的資助,成果已用到北京聯閤大學智能車上。
本書作為視頻圖像處理技術理論研究和應用的一本學術專著,參考瞭國內外大量的相關文獻,總結瞭我們近幾年來的研究成果,並提供瞭大量的實際案例,通過實際案例的實現和解析,為讀者提供一個視頻圖像處理算法在GPU上實現和優化的具體思路和方法。讀者通過本書的閱讀和學習,不僅可以學習視頻圖像處理技術在智能駕駛中的應用,而且可以瞭解GPU程序從實現到優化的具體方法。雖然本書實際案例的實現都是基於CUDA,但是本書也比較瞭CUDA和OpenCL的異同,本書描述的優化方法也可以非常方便地移植到OpenCL程序的編寫和優化中。
本書可以分成如下四個邏輯單元:
視頻圖像處理技術在智能駕駛中的應用:第2章在分析瞭當前國內外主●●●●● 視頻圖像處理與性能優化Ⅵ 流的智能駕駛技術後,詳細介紹瞭在智能駕駛中應用廣泛的幾類視頻圖像處理算法,包括:車道綫的提取和跟蹤技術、交通標誌牌的檢測和識彆技術、交通信號燈的檢測與識彆技術等。
GPU硬件架構與編程:第3章介紹瞭CPU與GPU架構的主要區彆,在此基礎上,對當前主流的GPU架構特徵(包括NVIDAGPU和AMDGPU) 進行瞭詳細介紹,這是進行GPU並行編程和優化的前提。第4章介紹瞭當前GPU主要的編程模型:CUDA和OpenCL,不僅介紹瞭這兩種編程模型的關鍵概念和定義、兩種編程模型的異同;而且通過一個簡單的例子介紹瞭使用這兩種編程模型進行GPU編程的主要流程和方法,最後給齣瞭GPU程序性能優化的主要思路。
實際案例分析:第5章介紹瞭矩陣轉置、規約算法、resize算法和La�瞤lace算法等主要的視頻圖像處理算子在GPU上的實現和優化方法,結閤具體算法詳細分析瞭GPU編程和優化思路和方法。最後第6~8章分彆給齣瞭Can�瞡y、人臉檢測以及激光雷達算法等具體實際應用案例的GPU移植和優化方法。
性能與能耗:第9章從能效評價指標、各層次能耗優化策略以及係統級能耗優化技術三個方麵介紹瞭在高性能計算以及智能駕駛中對性能與能耗的權衡。
本書由梁軍、賈海鵬著,其中肖琳、鬍正坤、梁愛華、許武、李威、王晶、魏鞦明和李誌豪參與瞭本書的編輯整理工作。在本書編寫、齣版的過程中,得到瞭鮑泓教授主持的國傢自然科學基金重大研究計劃項目(91420202)的資助,同時,也參考瞭國內外大量的論文和專著,在此一並錶示感謝。
由於時間倉促,書中難免會齣現錯誤和不妥之處,懇請廣大讀者不吝批評指正。
梁 軍賈海鵬
視頻圖像處理技術在智能汽車以及無人駕駛中的應用非常廣泛,如車道綫識彆、前方車輛的檢測與識彆、交通標誌牌的識彆、紅綠燈識彆等。視頻圖像處理技術在智能駕駛中的應用中除瞭需要滿足可靠性和魯棒性兩方麵的要求外,實時性也是非常重要的要求。能夠實時對道路的實際情況做齣反應,是智能駕駛安全的重要保證。因此,在保證算法可靠性和魯棒性的前提下,研究視頻圖像實時處理算法和技術對於智能駕駛來說至關重要。
隨著通用計算圖形處理器(GeneralPurposeGraphicProcessingUnit,GPGPU)技術的發展,GPU的應用也越來越廣泛。英偉達(NVIDIA) Tegra係列高性能GPU計算平颱推齣後,利用高性能計算技術實現智能駕駛中視頻圖像的實時處理成為重要的發展趨勢。然而,如何編寫正確、高效的GPU並行程序成為軟件開發人員麵臨的一大挑戰,同時GPU並行程序的調試、性能剖析也日益成為GPU並行軟件開發的難題。GPU並行程序開發和優化的本質是實現算法特徵嚮底層硬件架構特徵的高效映射,這就對GPU並行軟件開發人員提齣瞭更高的要求:不僅要瞭解算法特徵,而且要對底層架構有著清晰的認識。這無疑增加瞭將GPU高性能計算技術應用到智能駕駛視頻圖像實時處理應用中的難度。
在這種背景下,本書的齣現非常及時。本書從視頻圖像處理在智能駕駛中的應用、GPU體係架構與編程模型、GPU編程與優化、GPU優化實際案例剖析、性能與能耗的權衡五個方麵,詳細討論瞭利用GPU高性能計算技術實現智能駕駛視頻圖像實時處理的關鍵方法。GPU編程的重要內容是性能優化,這就需要軟件開發人員在詳細瞭解GPU硬件架構特徵的基礎上,根據實際的算法特徵,選擇最優的優化方法組閤,從而實現算法的最佳性能。本書詳細介紹瞭NVIDIA和AMD多代GPU計算平颱的架構特點,計算統一設備架構(ComputeUnifiedDeviceArchitec�瞭ure,CUDA)與開放計算語言(OpenComputingLanguage,OpenCL) 兩種GPU編程模型的比較以及GPU通用優化方法,同時提供瞭大量的實際案例,更加深入地討論GPU優化方法的選擇與應用方式。通過本書,讀者可以瞭解視頻圖像處理技術在智能駕駛中的應用和GPU架構的發展,學習如何使用CUDA開發高性能的GPU程序,包括訪存優化、計算優化和數據本地化優化等。
本書作者梁軍是北京聯閤大學副教授,李德毅院士智能車團隊的重要成員。研究方嚮包括智能駕駛、並行算法及並行軟件的設計與開發等,實際參與瞭多輛智能車並行軟件的開發、調試和應用,本書是作者根據自己在智能駕駛領域多年的研究●●●●● 視頻圖像處理與性能優化Ⅳ 基礎和實際並行編程經驗,從開發優秀GPU並行軟件的本質齣發,以通俗易懂的方式對最為關鍵的基本知識和技術進行瞭細緻講解。本書既可成為智能駕駛領域的參考書籍,也可供GPU並行軟件開發人員及高校師生參考。
視頻圖像處理與性能優化 下載 mobi epub pdf txt 電子書 格式