【有庫存】NT售價: 445 元
Intel音視頻團隊與阿里巴巴圖像處理專家聯合撰寫,知名專家聯袂推薦,深入解析OpenCV DNN 模塊、基于GPU/CPU的加速實現、性能優化技巧與可視化工具,以及人臉活體檢測(完整案例)與主流識別項目解析。第1~2章介紹了OpenCV編譯、運行,深度學習模塊(Open DNN)的架構、實現原理,以及深度學習的數學基礎與如何快速上手。第3~5章主要介紹了OpenCV的GPU加速原理,涵蓋必要的并行計算知識、Intel GPU硬件結構,以及OpenCL和Vulkan加速實現,是性能優化工作的核心。第6章介紹了CPU的硬件知識,以及深度學習模塊的CPU加速方法,重點講解了指令集SIMD加速,討論了Halide后端加速、OpenVINO(Intel推理引擎)加速。第7章介紹了常用的深度神經網絡可視化工具——TensorBoard(適用于TensorFlow網絡格式),Netscope(適用于Caffe網絡格式),針對Intel硬件平臺的性能調優工具VTune,以及高階程序優化的思路和方法。第8~9章重點講解實踐細節,包括用深度學習方法處理計算機視覺的基本問題,以及一個完整的人臉活體檢測項目與主流識別項目解析。
序一序二序三序四前言第1章OpenCV和深度學習 11.1 OpenCV處理流程 11.1.1 OpenCV庫 11.1.2 OpenCV深度學習應用的典型流程 31.2 機器學習的數學視角 51.2.1 機器學習和非機器學習 51.2.2 從人工神經網路到深度學習 81.2.3 破除神秘——神經網路是如何訓練的 111.3 OpenCV深度學習模組 161.3.1 主要特性 161.3.2 OpenCV DNN圖像分類舉例(Python) 171.4 本章小結 19第2章OpenCV深度學習模組解析 202.1 深度學習模組分層架構總覽 202.2 語言綁定和測試層 212.2.1 深度學習模組的Python語言綁定 212.2.2 深度學習模組的正確性測試和性能測試 232.3 API層 302.3.1 Layer 類及如何定制一個新的層類型 302.3.2 Net 類 322.3.3 常用函數 352.4 DNN引擎層 372.4.1 模型導入 372.4.2 推理引擎資料物件管理 432.4.3 推理引擎重點層解釋 472.4.4 層的合併優化 622.5 引擎加速層 662.5.1 深度學習模組支援的運算目標設備 672.5.2 深度學習模組支援的加速後端 682.5.3 加速方式的選擇 692.6 本章小結 70第3章平行計算與GPU架構 713.1 平行計算淺談 713.2 Intel GPU架構及其在平行計算中的應用 743.2.1 Intel GPU的計算架構 743.2.2 兩種不同的SIMD使用思路——AOS和SOA 823.2.3 cl_intel_subgroups 在 Intel GPU 上的參考實現 893.3 本章小結 100第4章基於Vulkan的加速實現 1014.1 初識Vulkan 1014.2 使用Vulkan加速 1024.3 Vulkan後端加速過程解析 1044.3.1 資料物件初始化 1054.3.2 後端運算節點初始化 1084.3.3 調用後端運算節點進行前向運算 1114.3.4 Vulkan後端庫 1134.4 本章小結 119第5章基於OpenCL的加速實現 1205.1 OpenCL簡介 1205.2 如何使用OpenCL加速 1255.3 OpenCL加速詳解 1285.3.1 OpenCL API封裝 1295.3.2 DNN模組的卷積層實現詳解 1325.3.3 ocl4dnn庫的卷積運算類詳解 1345.3.4 卷積核函數auto-tuning機制解析 1385.4 本章小結 143第6章CPU及協力廠商庫加速的實現 1446.1 原生CPU加速實現 1446.1.1 基於多執行緒技術的加速 1476.1.2 基於並行指令的加速 1536.2 Halide後端的實現 1576.2.1 Halide介紹 1586.2.2 如何啟用Halide 1636.2.3 Halide後端的實現原理 1656.3 Intel推理引擎後端的實現 1716.3.1 Intel推理引擎介紹 1716.3.2 如何啟用推理引擎後端 1726.3.3 Intel推理引擎後端的實現原理 1766.4 本章小結 185第7章視覺化工具與性能優化 1867.1 Netscope:基於Web的Caffe網路視覺化工具 1867.2 TensorBoard:助力TensorFlow程式的理解和調試 1887.2.1 圖的視覺化 1887.2.2 數據的視覺化 1917.2.3 調試的視覺化 1977.3 VTune:Intel 平臺的性能調優 1997.3.1 系統性能查看工具 2007.3.2 Intel VTune 功能介紹 2027.3.3 VTune 程式性能優化實例 2117.4 程式優化流程總結和建議 2137.5 本章小結 215第8章支付級人臉識別專案開發實戰 2168.1 活體檢測的概念與方法 2168.2 支付級人臉識別專案流程 2188.3 基於OpenCV的支付級人臉識別項目具體實現 2208.3.1 數據準備 2228.3.2 活體檢測模型訓練 2308.3.3 支付級人臉識別系統實現 2388.4 本章小結 244第9章深度學習模組不同場景下的應用實踐 2459.1 圖像分類 2459.1.1 圖像分類經典網路結構 2459.1.2 GoogLeNet 2479.1.3 圖像分類程式源碼分析 2499.1.4 圖像分類程式運行結果 2559.2 目標檢測 2569.2.1 SSD演算法解析 2569.2.2 目標檢測程式源碼分析 2579.2.3 目標檢測程式運行結果 2609.3 語義分割 2619.3.1 FCN模型 2629.3.2 語義分割程式源碼分析 2639.3.3 語義分割程式運行結果 2679.4 視覺風格變換 2689.4.1 視覺風格變換模型 2689.4.2 視覺風格變換程式源碼分析 2699.4.3 視覺風格變換程式運行結果 2719.5 本章小結 273附錄AOpenCV的編譯安裝及patch開發流程 274附錄Bintel_gpu_frequency工具的安裝和使用 280