-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

加速MATLAB編程指南——CUDA實現

( 簡體 字)
作者:趙地類別:1. -> 工程繪圖與工程計算 -> Matlab
譯者:
出版社:清華大學出版社加速MATLAB編程指南——CUDA實現 3dWoo書號: 49632
詢問書籍請說出此書號!

缺書
NT售價: 295

出版日:8/1/2018
頁數:200
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787302493174
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

內容簡介:

MATLAB是廣泛應用的算法開發語言之一。然而,MATLAB簡單易用的特性與算法復雜性的矛盾,造成了各個領域的MATLAB程序運行緩慢。本書總結了作者多年來在算法開發工作中關于MATLAB程序加速的實戰經驗,系統地介紹了利用GPU計算能力和CUDA編程語言實現加速MATLAB編程的方法。
本書首先介紹了MATLAB程序的性能評估的方法,幫助讀者找到制約MATLAB程序運行速度的“瓶頸”所在; 接著循序漸進地介紹加速MATLAB編程的方法,包括基于多核處理器的MATLAB程序加速、基于大內存和向量化的MATLAB程序加速、基于并行計算工具箱和GPU計算的MATLAB加速、基于CUDA庫的MATLAB加速、基于CUDA語言的MATLAB加速等。同時,本書附帶了大量程序實例,包括深度學習及大數據分析領域的例子,深入淺出地示范各種基于CUDA語言的MATLAB程序加速的技巧。
本書可幫助讀者對所在領域的MATLAB應用程序進行顯著加速,大幅提升算法開發的效率。
目錄:

第1章緒論
1.1MATLAB程序的加速
1.2MATLAB程序加速的可能途徑
1.2.1基于多核CPU的MATLAB程序加速
1.2.2基于大內存的MATLAB程序加速
1.2.3基于英偉達公司GPU的MATLAB程序加速
1.2.4基于AMD公司GPU的MATLAB程序加速
1.2.5基于Intel公司XeonPhi的MATLAB程序加速
1.3MATLAB程序加速的度量
1.4基于GPU計算的MATLAB程序的編制
1.4.1并行計算工具箱簡介
1.4.2CUDA庫
1.4.3CUDA編程
第2章MATLAB程序的性能評估
2.1bench()函數
2.2tic()函數/toc()函數
2.3timeit()函數
2.4cputime()函數
2.5clock()函數和etime()函數
2.6gputimeit()函數
2.7MATLAB探查器
第3章基于多核處理器的MATLAB程序加速
3.1MATLAB矩陣及運算符
3.1.1MATLAB矩陣的創建
3.1.2矩陣的性質的檢驗
3.1.3MATLAB矩陣的操作
3.2MATLAB函數
3.2.1MATLAB函數的定義
3.2.2MATLAB函數的執行
3.3語句與代碼
3.3.1分支結構
3.3.2循環結構
3.4MATLAB代碼
3.5MATLAB并行設置
3.6基于并行for循環(parfor循環)的MATLAB程序加速
第4章基于大內存的MATLAB程序的加速
4.1內存條的選擇與安裝
4.2內存預分配
4.2.1已知數組大小
4.2.2未知數組大小
4.3MATLAB向量化簡介
4.4MATLAB矩陣運算的向量化
4.4.1創建MATLAB矩陣的函數
4.4.2數據復制
4.4.3MATLAB的矩陣變換函數
4.4.4索引
4.4.5矩陣操作的向量化
4.4.6符合條件的元素總數
4.5MATLAB函數的向量化
4.5.1基于arrayfun()函數、bsxfun()函數、cellfun()函數、
spfun()函數和structfun()函數的向量化
4.5.2基于pagefun()函數的向量化
4.6MATLAB語句的向量化
第5章基于并行計算工具箱的MATLAB加速
5.1GPU卡的選擇與安裝
5.1.1GPU卡的選擇
5.1.2電源功率
5.1.3散熱問題
5.2基于并行計算工具箱的GPU計算簡介
5.3基于并行計算工具箱的矩陣運算
5.3.1在設備端(GPU端)直接創建MATLAB矩陣
5.3.2在設備端(GPU端)生成隨機數矩陣
5.3.3設備端(GPU端)的稀疏矩陣
5.3.4設備端(GPU端)矩陣的數據類型
5.3.5設備端(GPU端)矩陣的檢驗
5.3.6設備端(GPU端)矩陣的操作
5.4基于并行計算工具箱的設備端(GPU端)函數
5.4.1設備端(GPU端)函數的定義
5.4.2設備端(GPU端)函數的執行
5.5基于設備端(GPU端)大內存的MATLAB程序的加速
5.6例子
5.6.1卷積神經網絡前向傳播的卷積層
5.6.2卷積神經網絡前向傳播的激活函數
5.6.3卷積神經網絡前向傳播的降采樣層
5.6.4卷積神經網絡后向傳播的升采樣層
5.6.5卷積神經網絡后向傳播的卷積層
5.6.6卷積神經網絡后向傳播中的梯度計算
第6章MATLAB與C/C++的接口
6.1MEX庫API
6.1.1MEX相關的函數
6.1.2從MEX中調用MATLAB函數
6.1.3mexGet()函數
6.1.4MEX庫API與輸入輸出相關的函數
6.1.5MEX庫API與鎖定相關的函數
6.2MATLAB的C/C++矩陣庫API
6.2.1定義MEX函數的數據類型
6.2.2創建數組、分配內存和釋放內存
6.2.3數據類型校驗:數組的數據類型和性質
6.2.4數據存取:從數組讀取和寫入數據
6.2.5數據類型轉換:將字符串數組和結構數組轉換成對象數組
6.3MEX函數編譯器
6.3.1MEX介紹
6.3.2編譯MEX
6.3.3MEX文件的查錯
第7章基于CUDA庫的MATLAB加速
7.1基于CUDA庫的MATLAB加速簡介
7.2基于ArrayFire庫的MATLAB加速簡介
7.2.1ArrayFire簡介
7.2.2ArrayFire數組
7.2.3ArrayFire函數
7.2.4CUDA的混合編程
7.2.5實例
7.3基于其他CUDA庫的MATLAB加速簡介
第8章GPU計算簡介
8.1芯片技術的發展與摩爾定律
8.2每秒浮點運算次數
8.3GPU計算加速的度量
8.3.1GPU程序的加速比
8.3.2阿姆達爾定律和古斯塔夫森定律
8.3.3并行程序的并行狀況
8.4并行計算部件
8.4.1張量處理器
8.4.2現場可編程門陣列
8.4.3類腦處理器
8.4.4視覺處理器
8.4.5物理處理器
8.4.6圖形處理器
8.5英偉達公司GPU簡介
8.5.1計算單元
8.5.2GPU內存
8.5.3計算能力
8.5.4GPU當前狀態的檢測
8.5.5GPU集群設置
8.5.6集群管理軟件
第9章CUDA編程簡介
9.1CUDA核
9.2CUDA線程與線程塊
9.2.1CUDA線程
9.2.2CUDA線程塊
9.3內存結構與管理
9.3.1全局內存
9.3.2共享內存
9.3.3鎖頁內存
9.3.4紋理內存和表面內存
9.4并行管理
9.4.1非同步并行執行
9.4.2流和事件
9.4.3同步調用
9.5CUDA流
9.5.1CUDA流的創建和結束
9.5.2默認CUDA流
9.5.3顯式同步
9.5.4隱式同步
9.5.5重疊行為
9.5.6回調函數
9.5.7CUDA流的優先級
9.6CUDA事件
9.6.1CUDA事件的創建與清除
9.6.2CUDA事件的運行
9.7多設備系統
9.7.1多設備系統的初始化
9.7.2多設備系統的設備計數
9.7.3多設備系統的設備選擇
9.7.4多設備系統的CUDA流和CUDA事件
9.7.5不通過統一虛擬地址的多設備系統的設備間的內存復制
9.7.6通過統一虛擬地址的多設備系統的設備間的內存復制
9.8動態并行
9.8.1動態并行簡介
9.8.2動態并行的編程模型
9.8.3動態并行的環境配置
9.8.4動態并行的內存管理
9.8.5動態并行的嵌套深度
9.9統一虛擬地址空間
9.9.1統一虛擬地址空間簡介
9.9.2統一內存編程的優點
9.9.3統一內存分配
9.9.4統一內存的連續性與并行性
9.9.5統一內存的檢驗
9.9.6統一內存的性能優化
9.10CUDA的編譯
9.10.1CUDA編譯工作流
9.11CUDA程序實例
9.11.1序列蒙特卡羅的類別分布隨機數
9.11.2哈爾變換
第10章CUDA程序優化
10.1CUDA程序優化的策略
10.2指令級別的優化
10.2.1算術指令吞吐量最大化
10.2.2控制流指令
10.2.3同步指令
10.3線程和線程塊級別的優化
10.3.1warp簡介
10.3.2CUDA線程塊的warp數量
10.3.3CUDA占用率
10.3.4線程warp對設備端(GPU端)內存讀寫
10.4CUDA核級別的優化
10.4.1優化CUDA核參數
10.4.2減少內存同步
10.4.3減少寄存器總量
10.4.4提高指令層次的并行度
10.5CUDA程序級別的優化
第11章基于CUDA的MATLAB加速
11.1基于CUDAKernel的MATLAB加速
11.2基于MEX函數的MATLAB加速
11.3多GPU編程
11.4例子
11.4.1基于MEX函數的多GPU矩陣相加
11.4.2基于MEX函數的多GPU的LSE函數
第12章總結
12.1加速MATLAB編程方法的比較
12.2進一步加速MATLAB
12.2.1多路多核處理器的MATLAB程序加速
12.2.2基于AMD公司GPU的MATLAB程序加速
12.2.3基于Intel公司XeonPhi的MATLAB程序加速
參考文獻
序: