發表於2025-01-22
基本信息
書名:OpenCL異構並行計算:原理、機製與優化實踐
定價:79.00元
作者:劉文誌,陳軼,吳長江 著
齣版社:機械工業齣版社
齣版日期:2015-11-01
ISBN:9787111519348
字數:
頁碼:
版次:1
裝幀:平裝
開本:16開
商品重量:
編輯推薦
目 錄 序一序二前言第章 異構並行計算的過去、現狀和未來1.1 單核標量處理器的睏境1.1.1 單核標量處理器如何提高性能1.1.2 為什麼單核標量處理器性能到達瓶頸1.2 多核並行計算與嚮量化的齣現1.2.1 為什麼會有多核1.2.2 為什麼會有嚮量化1.2.3 如何利用多核和嚮量化的能力1.2.4 多核和嚮量化的難點1.3 異構並行計算的崛起1.3.1 的理念1.3.2 的崛起1.3.3 橫空齣世1.4 異構並行計算的未來(花齊放)1.5 本章小結第章 的基本介紹2.1 什麼是2.2 平颱模型2.3 執行模型2.3.1 上下文2.3.2 命令隊列2.3.3 內核在設備上執行2.4 存儲器模型2.4.1 存儲器區域2.4.2 存儲器對象2.4.3 共享虛擬存儲器2.5 與2.6 與2.7 本章小結第章 進入的世界(矢量加法)3.1 構建示例3.1.1 平颱3.1.2 平颱3.1.3 平颱3.1.4 矢量加示例3.2 獲得平颱和設備及其屬性3.2.1 平颱3.2.2 設備3.3 創建上下文和命令隊列3.3.1 創建上下文3.3.2 創建命令隊列3.4 創建程序對象和內核對象3.5 程序對象3.5.1 創建程序對象3.5.2 構建程序對象3.5.3 查詢和管理程序對象3.6 內核對象3.6.1 創建內核對象3.6.2 設置內核參數3.6.3 查詢和管理內核對象3.7 執行內核3.8 編寫內核代碼3.9 錯誤處理3. 本章小結第章 語言4.1 修飾符4.1.1 地址空間修飾符4.1.2 函數修飾符4.1.3 對象訪問修飾符4.2 標量數據類型4.3 矢量數據類型4.3.1 為什麼要有矢量數據類型4.3.2 矢量數據的使用4.4 運算符4.5 工作項布局函數4.5.1 維度和工作項4.5.2 工作組4.6 數據拷貝操作4.6.1 矢量數據拷貝4.6.2 異步拷貝和預取4.7 浮點函數4.7.1 數學函數4.7.2 公共函數4.7.3 幾何函數4.8 整數函數4.9 關係函數4. 雜項矢量函數4.11 同步函數4.12 原子函數4.13 圖像讀寫函數4.13.1 內建圖像讀函數4.13.2 內建無采樣器圖像讀 函數4.13.3 內建圖像寫函數4.13.4 內建圖像查詢函數4.14 工作組函數4.15 管道函數4.15.1 內建管道讀寫函數4.15.2 內建工作組管道讀寫函數4.15.3 內建管道查詢函數4.16 設備隊列4.16.1 語法4.16.2 設備隊列相關函數4.16.3 子內核存儲器可見性4.16.4 設備隊列的使用示例4.17 本章小結第章 存儲器對象5.1 緩衝區5.1.1 分配緩衝區對象5.1.2 創建子緩衝區對象5.2 圖像對象和采樣器對象5.2.1 圖像對象5.2.2 采樣器對象5.2.3 圖像鏇轉示例5.3 管道5.3.1 創建管道對象5.3.2 管道對象查詢5.4 存儲器對象數據傳輸5.4.1 主機與設備間數據傳輸5.4.2 存儲器對象數據填充5.4.3 存儲器對象間數據傳輸5.4.4 存儲器對象映射5.5 共享虛擬存儲器5.5.1 緩衝操作5.5.2 類型和特性5.5.3 相關示例5.6 存儲器一緻性模型5.6.1 存儲器次序規則5.6.2 原子操作的存儲器次序規則5.6.3 柵欄操作的存儲器次序規則5.6.4 工作組函數的存儲器次序規則5.6.5 主機端與設備端命令的存儲器次序規則5.6.6 關於存儲器次序在實際計算設備中的實現5.7 本章小結第章 同步及事件機製6.1 主機端的同步6.2 事件機製6.2.1 對事件的標記和柵欄6.2.2 內核程序中的同步6.2.3 工作組內同步6.3 原子操作6.3.1 中的原子操作6.3.2 中的原子操作6.4 局部存儲器與全局存儲器間的異步拷貝6.5 工作組間同步6.6 本章小結第章 與互操作7.1 從一個上下文來創建上下文7.2 使用共享的緩存對象7.3 使用紋理數據7.4 共享渲染緩存7.5 從一個存儲器對象查詢對象信息7.6 訪問共享對象的與之間的同步7.7 本章小結第章 到主流處理器的映射8.1 傢族8.1.1 架構8.1.2 架構的8.2 兼容的8.2.1 架構的執行模型8.2.2 的全局存儲器8.2.3 的局部存儲器8.3 架構8.3.1 硬件架構8.3.2 存儲器層次8.3.3 映射8.4 本章小結第章 計算二維捲積9.1 測試平颱信息9.2 串行實現9.2.1 簡單實現9.2.2 循環展開優化實現9.2.3 指令集優化9.2.4 9.3 簡單實現9.4 使用常量存儲器優化9.5 使用局部存儲器優化9.6 一個工作項同時計算多個輸齣9.7 本章小結第章 計算矩陣乘法.1 串行實現.1.1 初次實現.1.2 緩存友好的實現.1.3 使用指令集實現.2 簡單實現.3 使用局部存儲器優化.4 使用嚮量加載指令.5 一個工作項同時計算多個輸齣.6 優化流水綫性能.7 本章小結附錄 實例附錄 其他主流異構並行計算編程環境簡介
<
目錄
目 錄 序一序二前言第章 異構並行計算的過去、現狀和未來1.1 單核標量處理器的睏境1.1.1 單核標量處理器如何提高性能1.1.2 為什麼單核標量處理器性能到達瓶頸1.2 多核並行計算與嚮量化的齣現1.2.1 為什麼會有多核1.2.2 為什麼會有嚮量化1.2.3 如何利用多核和嚮量化的能力1.2.4 多核和嚮量化的難點1.3 異構並行計算的崛起1.3.1 的理念1.3.2 的崛起1.3.3 橫空齣世1.4 異構並行計算的未來(花齊放)1.5 本章小結第章 的基本介紹2.1 什麼是2.2 平颱模型2.3 執行模型2.3.1 上下文2.3.2 命令隊列2.3.3 內核在設備上執行2.4 存儲器模型2.4.1 存儲器區域2.4.2 存儲器對象2.4.3 共享虛擬存儲器2.5 與2.6 與2.7 本章小結第章 進入的世界(矢量加法)3.1 構建示例3.1.1 平颱3.1.2 平颱3.1.3 平颱3.1.4 矢量加示例3.2 獲得平颱和設備及其屬性3.2.1 平颱3.2.2 設備3.3 創建上下文和命令隊列3.3.1 創建上下文3.3.2 創建命令隊列3.4 創建程序對象和內核對象3.5 程序對象3.5.1 創建程序對象3.5.2 構建程序對象3.5.3 查詢和管理程序對象3.6 內核對象3.6.1 創建內核對象3.6.2 設置內核參數3.6.3 查詢和管理內核對象3.7 執行內核3.8 編寫內核代碼3.9 錯誤處理3. 本章小結第章 語言4.1 修飾符4.1.1 地址空間修飾符4.1.2 函數修飾符4.1.3 對象訪問修飾符4.2 標量數據類型4.3 矢量數據類型4.3.1 為什麼要有矢量數據類型4.3.2 矢量數據的使用4.4 運算符4.5 工作項布局函數4.5.1 維度和工作項4.5.2 工作組4.6 數據拷貝操作4.6.1 矢量數據拷貝4.6.2 異步拷貝和預取4.7 浮點函數4.7.1 數學函數4.7.2 公共函數4.7.3 幾何函數4.8 整數函數4.9 關係函數4. 雜項矢量函數4.11 同步函數4.12 原子函數4.13 圖像讀寫函數4.13.1 內建圖像讀函數4.13.2 內建無采樣器圖像讀 函數4.13.3 內建圖像寫函數4.13.4 內建圖像查詢函數4.14 工作組函數4.15 管道函數4.15.1 內建管道讀寫函數4.15.2 內建工作組管道讀寫函數4.15.3 內建管道查詢函數4.16 設備隊列4.16.1 語法4.16.2 設備隊列相關函數4.16.3 子內核存儲器可見性4.16.4 設備隊列的使用示例4.17 本章小結第章 存儲器對象5.1 緩衝區5.1.1 分配緩衝區對象5.1.2 創建子緩衝區對象5.2 圖像對象和采樣器對象5.2.1 圖像對象5.2.2 采樣器對象5.2.3 圖像鏇轉示例5.3 管道5.3.1 創建管道對象5.3.2 管道對象查詢5.4 存儲器對象數據傳輸5.4.1 主機與設備間數據傳輸5.4.2 存儲器對象數據填充5.4.3 存儲器對象間數據傳輸5.4.4 存儲器對象映射5.5 共享虛擬存儲器5.5.1 緩衝操作5.5.2 類型和特性5.5.3 相關示例5.6 存儲器一緻性模型5.6.1 存儲器次序規則5.6.2 原子操作的存儲器次序規則5.6.3 柵欄操作的存儲器次序規則5.6.4 工作組函數的存儲器次序規則5.6.5 主機端與設備端命令的存儲器次序規則5.6.6 關於存儲器次序在實際計算設備中的實現5.7 本章小結第章 同步及事件機製6.1 主機端的同步6.2 事件機製6.2.1 對事件的標記和柵欄6.2.2 內核程序中的同步6.2.3 工作組內同步6.3 原子操作6.3.1 中的原子操作6.3.2 中的原子操作6.4 局部存儲器與全局存儲器間的異步拷貝6.5 工作組間同步6.6 本章小結第章 與互操作7.1 從一個上下文來創建上下文7.2 使用共享的緩存對象7.3 使用紋理數據7.4 共享渲染緩存7.5 從一個存儲器對象查詢對象信息7.6 訪問共享對象的與之間的同步7.7 本章小結第章 到主流處理器的映射8.1 傢族8.1.1 架構8.1.2 架構的8.2 兼容的8.2.1 架構的執行模型8.2.2 的全局存儲器8.2.3 的局部存儲器8.3 架構8.3.1 硬件架構8.3.2 存儲器層次8.3.3 映射8.4 本章小結第章 計算二維捲積9.1 測試平颱信息9.2 串行實現9.2.1 簡單實現9.2.2 循環展開優化實現9.2.3 指令集優化9.2.4 9.3 簡單實現9.4 使用常量存儲器優化9.5 使用局部存儲器優化9.6 一個工作項同時計算多個輸齣9.7 本章小結第章 計算矩陣乘法.1 串行實現.1.1 初次實現.1.2 緩存友好的實現.1.3 使用指令集實現.2 簡單實現.3 使用局部存儲器優化.4 使用嚮量加載指令.5 一個工作項同時計算多個輸齣.6 優化流水綫性能.7 本章小結附錄 實例附錄 其他主流異構並行計算編程環境簡介
<
內容提要
本書一共分為個部分:第章介紹並行計算的沿革與現狀。第章介紹瞭語言的相關語法。第章到第章講解瞭運行時接口及其功能。第章講解瞭更底層的工作機製,並結閤當前主流的做詳細分析。第章到第章則是以四個實際常用算法來介紹如何用做加速並行計算。通過閱讀本書,讀者不僅能全麵掌握的常規用法,而且還能深入瞭解的運作機製,如何將計算設備的性能發揮到。這樣就可以充分利用硬件特性來調整算法,使得計算速度能達到峰值。
文摘
暫無相關內容
作者介紹
暫無相關內容
OpenCL異構並行計算:原理、機製與優化實踐 OpenCL 2.0編程教程書籍 API平 下載 mobi pdf epub txt 電子書 格式 2025
OpenCL異構並行計算:原理、機製與優化實踐 OpenCL 2.0編程教程書籍 API平 下載 mobi epub pdf 電子書評分
評分
評分
評分
評分
評分
評分
評分
OpenCL異構並行計算:原理、機製與優化實踐 OpenCL 2.0編程教程書籍 API平 mobi epub pdf txt 電子書 格式下載 2025