-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

多核應用編程實戰

( 簡體 字)
作者:[美] Darryl Gove 類別:1. -> 程式設計 -> 綜合
譯者:
出版社:人民郵電出版社多核應用編程實戰 3dWoo書號: 35641
詢問書籍請說出此書號!

缺書
NT售價: 395

出版日:6/1/2013
頁數:345
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787115317506
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

內容簡介:

《多核應用編程實戰》是一本全面實用的多核應用編程指南,旨在介紹如何編寫功能正確、性能優越且適合擴展為在多個CPU核心的系統運行的應用程序。《多核應用編程實戰》面向多種操作系統和處理器類型引用程序示例,內容涵蓋類UNIX操作系統(Linux、Oracle Solaris、OS X)和Windows系統上多核應用的編寫方法、多核的硬件實現對應用程序的性能影響、編寫并行應用程序時要避免的潛在問題,以及如何編寫可擴展至大量并行線程的應用程序。
《多核應用編程實戰》適合所有C程序員學習參考。
目錄:

第1章 硬件、進程和線程 1
1.1 計算機的內部結構 1
1.2 多核處理器的緣起 3
1.2.1 在單芯片上支持多線程 4
1.2.2 通過處理器核心流水線作業提高指令發出率 8
1.2.3 使用緩存保存最近使用的數據 10
1.2.4 用虛擬內存存儲數據 12
1.2.5 從虛擬地址轉換到物理地址 13
1.3 多處理器系統的特征 14
1.4 源代碼到匯編語言的轉換 16
1.4.1 32位與64位代碼的性能 18
1.4.2 確保內存操作的正確順序 19
1.4.3 進程和線程的差異 21
1.5 小結 23

第2章 高性能編碼 24
2.1 定義性能 24
2.2 了解算法復雜度 25
2.2.1 算法復雜度的示例 26
2.2.2 算法復雜度的重要性 28
2.2.3 謹慎運用算法復雜度 30
2.3 結構如何影響性能 30
2.3.1 在源代碼和生成結構上權衡性能和便利性 30
2.3.2 利用庫結構化應用程序 33
2.3.3 數據結構對性能的影響 42
2.4 編譯器的作用 47
2.4.1 兩種編譯器優化 48
2.4.2 選擇合適的編譯器選項 50
2.4.3 如何用跨文件優化提高性能 51
2.4.4 使用配置文件反饋 53
2.4.5 潛在的指針別名會如何抑制編譯器優化 55
2.5 通過分析確定占用時間的地方 58
2.6 怎樣避免手動優化 64
2.7 從設計角度看性能 64
2.8 小結 65

第3章 識別并行機會 66
3.1 使用多進程提高系統工作效率 66
3.2 多用戶使用一個系統 67
3.3 通過整合提高機器工作效率 68
3.3.1 用容器隔離共享一個系統的應用程序 69
3.3.2 使用虛擬機監控程序托管多個操作系統 69
3.4 采用并行機制提高單個任務的性能 71
3.4.1 理解并行應用程序 72
3.4.2 并行如何影響算法的選擇 72
3.4.3 Amdahl定律 73
3.4.4 確定最大實際線程數 75
3.4.5 同步成本怎樣降低擴展性 76
3.5 并行模式 78
3.5.1 使用SIMD指令的數據并行 78
3.5.2 通過進程或線程實現并行化 79
3.5.3 多個獨立任務 79
3.5.4 多個松散耦合的任務 80
3.5.5 相同任務的多個副本 81
3.5.6 單個任務拆分到多個線程 82
3.5.7 使用流水線任務完成某個事項 82
3.5.8 將工作分配給客戶端和服務器 83
3.5.9 將責任劃分給生產者和消費者 84
3.5.10 結合多種并行化策略 85
3.6 依賴關系對并行運行代碼能力的影響 85
3.6.1 反依賴和輸出依賴 86
3.6.2 通過推測打破依賴 88
3.6.3 關鍵路徑 91
3.7 發現并行機會 92
3.8 小結 93

第4章 同步和數據共享 94
4.1 數據爭用 94
4.1.1 使用工具檢測數據爭用 95
4.1.2 避免數據爭用 98
4.2 同步原語 98
4.2.1 互斥量和臨界區 98
4.2.2 自旋鎖 99
4.2.3 信號量 100
4.2.4 讀寫鎖 100
4.2.5 屏障 101
4.2.6 原子操作和無鎖代碼 102
4.3 死鎖和活鎖 103
4.4 線程和進程間的通信 104
4.4.1 內存、共享內存和內存映射文件 104
4.4.2 條件變量 105
4.4.3 信號和事件 107
4.4.4 消息隊列 108
4.4.5 命名管道 108
4.4.6 通過網絡棧進行通信 109
4.4.7 線程之間共享數據的其他方法 110
4.5 存儲線程私有數據 110
4.6 小結 112

第5章 使用POSIX線程 113
5.1 創建線程 113
5.1.1 線程終止 114
5.1.2 用子線程接收和傳遞數據 115
5.1.3 分離線程 116
5.1.4 設置pthread的屬性 117
5.2 編譯多線程代碼 119
5.3 進程終止 121
5.4 線程之間共享數據 122
5.4.1 使用互斥鎖保護訪問 122
5.4.2 互斥鎖屬性 124
5.4.3 使用自旋鎖 125
5.4.4 讀寫鎖 127
5.4.5 屏障 129
5.4.6 信號量 130
5.4.7 條件變量 136
5.5 變量和內存 140
5.6 多進程編程 143
5.6.1 在進程之間共享內存 144
5.6.2 在進程之間共享信號量 147
5.6.3 消息隊列 147
5.6.4 管道和命名管道 150
5.6.5 使用信號與進程通信 151
5.7 套接字 156
5.8 可重入代碼和編譯器標志 158
5.9 小結 160

第6章 Windows線程 161
6.1 創建Windows本機線程 161
6.1.1 終止線程 165
6.1.2 創建和重新啟動掛起的線程 167
6.1.3 使用內核資源的句柄 168
6.2 同步和資源共享的方式 168
6.2.1 線程間需要同步的一個例子 169
6.2.2 保護對臨界區代碼的訪問 170
6.2.3 用互斥量保護代碼段 172
6.2.4 輕量級讀寫鎖 173
6.2.5 信號量 175
6.2.6 條件變量 177
6.2.7 向其他線程或進程發出事件完成的信號 178
6.3 Windows中的寬字符串處理 179
6.4 創建進程 180
6.4.1 在進程之間共享內存 182
6.4.2 在子進程中繼承句柄 185
6.4.3 互斥量命名及其在進程間的共享 186
6.4.4 用管道通信 187
6.4.5 用套接字進行通信 190
6.5 變量的原子更新 193
6.6 分配線程本地存儲 195
6.7 設置線程的優先級 197
6.8 小結 198

第7章 自動并行化和OpenMP 199
7.1 使用自動并行化產生并行代碼 199
7.1.1 識別和并行約簡 203
7.1.2 對包含調用的代碼進行自動并行化 204
7.1.3 協助編譯器實現代碼的自動并行化 206
7.2 使用OpenMP生成并行應用程序 208
7.2.1 使用OpenMP并行化循環 209
7.2.2 OpenMP應用程序的運行時行為 210
7.2.3 OpenMP并行區域中的變量作用域 210
7.2.4 使用OpenMP并行化約簡 212
7.2.5 在并行區域外訪問私有數據 212
7.2.6 使用調度改進工作分配 214
7.2.7 用并行段完成獨立工作 217
7.2.8 嵌套并行 218
7.2.9 使用OpenMP動態定義并行任務 219
7.2.10 保持數據對線程私有 223
7.2.11 控制OpenMP運行時環境 225
7.2.12 等待工作完成 227
7.2.13 限制執行代碼區域的線程 229
7.3 確保并行區域的代碼按順序執行 232
7.4 折疊循環改進工作負荷均衡 233
7.5 強制實現內存一致性 234
7.6 并行化示例 235
7.7 小結 239

第8章 手工編碼的同步和共享 240
8.1 原子操作 240
8.1.1 用比較和交換指令構成更復雜的原子操作 242
8.1.2 強制實現內存排序以確保正確操作 245
8.1.3 編譯器對內存排序指令的支持 247
8.1.4 編譯器對操作的重新排序 247
8.1.5 易失變量 251
8.2 操作系統提供的原子操作 251
8.3 無鎖算法 254
8.3.1 Dekker算法 254
8.3.2 帶循環緩存的生產者/消費者 256
8.3.3 擴展到多個消費者或生產者 259
8.3.4 將生產者/消費者擴展到多個線程 260
8.3.5 更改生產者/消費者代碼為使用原子操作 266
8.3.6 ABA問題 268
8.4 小結 271

第9章 基于多核處理器的擴展 272
9.1 對應用程序擴展的限制 272
9.1.1 串行代碼對性能的限制 272
9.1.2 超線性擴展 275
9.1.3 工作負荷不均衡 276
9.1.4 熱鎖 277
9.1.5 庫代碼擴展 282
9.1.6 工作量不足 284
9.1.7 算法限制 286
9.2 擴展的硬件限制 288
9.2.1 核心之間的帶寬共享 288
9.2.2 偽共享 290
9.2.3 緩存沖突和容量 293
9.2.4 流水線資源匱乏 297
9.3 操作系統對擴展性的限制 301
9.3.1 過度訂閱 301
9.3.2 使用處理器綁定改善內存局部性 303
9.3.3 優先級反轉 310
9.4 多核處理器和擴展 310
9.5 小結 311

第10章 其他并行技術 312
10.1 基于GPU的運算 312
10.2 語言擴展 314
10.2.1 線程構建模塊 314
10.2.2 Cilk++ 317
10.2.3 Grand Central Dispatch 320
10.2.4 為未來C和C++標準提議的可能功能 321
10.2.5 微軟的C++/CLI 324
10.3 其他語言 325
10.4 集群技術 327
10.4.1 MPI 328
10.4.2 以MapReduce作為擴展策略 331
10.4.3 網格 332
10.5 事務性內存 332
10.6 向量化 333
10.7 小結 334

第11章 結束語 335
11.1 編寫并行應用程序 335
11.1.1 識別任務 335
11.1.2 估算性能提升 336
11.1.3 確定依賴關系 336
11.1.4 數據爭用和互斥鎖擴展限制 336
11.1.5 鎖的粒度 337
11.2 多核處理器上的并行代碼 337
11.3 并行化的未來 339

參考文獻 340
索引 342
序: