《科学计算与企业级应用的并行优化》

《科学计算与企业级应用的并行优化》 《科学计算与企业级应用的并行优化》

  • 书名:《科学计算与企业级应用的并行优化》:高性能计算技术丛书
  • 分类:计算机
  • 作者:刘文志
  • 出版社:机械工业出版社
  • 出版年:2015-7-1
  • 页码:190

《科学计算与企业级应用的并行优化》 内容介绍:

本书系统、深入讲解了科学计算及企业级应用的并行优化方法与最佳实践。第1章介绍了常见的并行编程基于的多核/众核向量处理器架构。第2章介绍了如何在X86、ARM和GPU上优化常见的线性代数运算。第3章介绍了如何在X86和GPU处理器上优化偏微分方程的求解。第4章介绍了如何在X86处理器和GPU上优化常见的分子动力学算法。第5章详细介绍了如何在X86、ARM和GPU上优化常见的机器学习算法。

《科学计算与企业级应用的并行优化》 目录大纲:

目录

前言
第1章 多核向量处理器架构 1
1.1 众核系统结构 2
1.2 众核架构的一致性 3
1.3 多核向量处理器架构 5
1.3.1 Intel Haswell CPU架构 6
1.3.2 ARM A15多核向量处理器架构 10
1.3.3 AMD GCN GPU架构 12
1.3.4 NVIDIA Kepler和Maxwell GPU架构 15
1.4 Intel MIC架构 21
1.4.1 整体架构 22
1.4.2 计算单元 22
1.4.3 存储器单元 24
1.4.4 MIC架构上一些容易成为瓶颈的设计 25
1.5 OpenCL程序在多核向量处理器上的映射 26
1.5.1 OpenCL程序在多核向量CPU上的映射 26
1.5.2 OpenCL程序在NVIDIA GPU上的映射 28
1.5.3 OpenCL程序在AMD GCN上的映射 34
1.6 OpenCL程序在各众核硬件上执行的区别 39
1.7 众核编程模式 42
1.8 众核性能优化 42
1.9 MIC和GPU编程比较 43
1.10 本章小结 43
第2章 常见线性代数算法优化 44
2.1 稀疏矩阵与向量乘法 44
2.1.1 稀疏矩阵的存储格式 45
2.1.2 CSR 格式稀疏矩阵与向量乘法 46
2.1.3 ELL格式稀疏矩阵与向量乘 56
2.2 对称矩阵与向量乘积 58
2.2.1 串行代码 59
2.2.2 向量化对称矩阵与向量乘积 60
2.2.3 OpenMP 并行化 60
2.2.4 CUDA 代码 60
2.3 三角线性方程组的解法 63
2.3.1 串行算法 64
2.3.2 串行算法优化 65
2.3.3 AVX 优化实现 65
2.3.4 NEON 优化实现 66
2.3.5 如何提高并行度 67
2.3.6 CUDA 算法实现 68
2.4 矩阵乘法 71
2.4.1 AVX指令计算矩阵乘法 72
2.4.2 NEON指令计算矩阵乘法 75
2.4.3 GPU计算矩阵乘法 77
2.5 本章小结 81
第3章 优化偏微分方程的数值解法 82
3.1 热传递问题 83
3.1.1 C代码及性能 84
3.1.2 OpenMP代码及性能 85
3.1.3 OpenACC代码及性能 87
3.1.4 CUDA代码 88
3.2 简单三维Stencil 91
3.2.1 串行实现 92
3.2.2 Stencil在X86处理器上实现的困境 93
3.2.3 CUDA实现 93
3.3 本章小结 96
第4章 优化分子动力学算法 97
4.1 简单搜索的实现 98
4.1.1 串行代码 99
4.1.2 向量化实现分析 100
4.1.3 OpenMP实现 101
4.1.4 CUDA实现 102
4.2 范德华力计算 104
4.2.1 串行实现 104
4.2.2 向量化实现分析 105
4.2.3 OpenMP实现 106
4.2.4 CUDA实现 106
4.2.5 如何提高缓存的利用 108
4.3 键长伸缩力计算 108
4.3.1 串行实现 109
4.3.2 向量化实现 111
4.3.3 OpenMP实现 111
4.3.4 CUDA实现 114
4.4 径向分布函数计算 116
4.4.1 串行实现 117
4.4.2 向量化实现 118
4.4.3 OpenMP实现 118
4.4.4 CUDA实现 121
4.5 本章小结 126
第5章 机器学习算法 127
5.1 k—means算法 128
5.1.1 计算流程 128
5.1.2 计算元素所属分类 129
5.1.3 更新分类中心 136
5.1.4 入口函数 140
5.2 KNN算法 142
5.2.1 计算步骤 142
5.2.2 相似度计算 143
5.2.3 求前k个相似度最大元素 144
5.2.4 统计所属分类 145
5.3 二维卷积 146
5.3.1 X86实现 147
5.3.2 ARM实现 152
5.3.3 CUDA实现 155
5.4 四维卷积 162
5.4.1 X86实现 163
5.4.2 ARM 实现 169
5.4.3 CUDA实现 172
5.5 多GPU并行优化深度学习软件Caffe 176
5.5.1 为什么要使用多GPU并行Caffe 177
5.5.2 AlexNet示例 177
5.5.3 Caffe的主要计算流程 180
5.5.4 多GPU并行卷积神经网络的方式 185
5.5.5 多GPU并行Caffe实践 187
5.6 本章小结 190


微信扫一扫关注公众号

0 个评论

要评论图书请先登录注册

你也许想看:

Learning Nagios 4

《Learning Nagios 4》

Wojciech Kocjan.Packt Publishing - ebooks Account.2014-3-25

“”

Exploding the Phone

《Exploding the Phone》

Lapsley, Philip..2013-2

“Before smartphones, back even before the Internet and person...”

深入理解Android 卷III

《深入理解Android 卷III》

张大伟.机械工业出版社.2015-8-1

“深入理解Android(卷3)》是Android经典畅销书系(对Android系统源代码的分析最为系统和细致)“深入理解...”

Rethinking the Internet of Things

《Rethinking the Internet of Things》

Francis daCosta.Apress.2014-1-5

“Over the next decade, most devices connected to the Internet...”

《自己动手设计数据库》

《《自己动手设计数据库》》

【美】Michael J. Hernandez(迈克尔•J•埃尔南德斯).电子工业出版社.2015-9

“《自己动手设计数据库》主要讲述数据库的设计,讨论了如何建立表结构、确定主键、设置字段说明、建立表关系、确立业务规则、建立...”

黑客大曝光(第6版)

《黑客大曝光(第6版)》

[美] Stuart McClure,Joel Scambray,George Kurtz.清华大学出版社.2010-1

“《黑客大曝光:网络安全机密与解决方案(第6版)》是全球销量第一的计算机信息安全图书,被信息安全界奉为圣经。作者独创“黑客...”

SQL Server 2012实施与管理实战指南

《SQL Server 2012实施与管理实战指南》

俞榕刚,徐海蔚.电子工业出版社.2013-3

“《SQL Server 2012实施与管理实战指南》主要面向对Microsoft SQL Server有一定基础的数据库...”

Learning Shell Scripting with Zsh

《Learning Shell Scripting with Zsh》

Gastón Festari.Packt Publishing.2014-1-15

“”

Clojure程序设计

《Clojure程序设计》

哈罗威 (Stuart Halloway),拜卓 (Aaron Bedra).人民邮电出版社.2013-4-1

“Clojure是一种基于Java虚拟机的动态编程语言。如果你要转移到函数式编程,或是要应对来自并发的挑战,那么,Cloj...”

爱上Arduino:学Arduino玩转Kinect制作项目

《爱上Arduino:学Arduino玩转Kinect制作项目》

Enrique Ramos Melgar,Ciriaco Castro Diez,Przemek Jaworski.人民邮电出版社.2014-3-1

“《爱上Arduino:学Arduino玩转Kinect制作项目》先介绍Arduino、Kinect和Processing...”

游戏的设计与开发

《游戏的设计与开发》

次世代工作室.人民交通出版社.2003-12

“”

深入网站开发与运维

《深入网站开发与运维》

[美] Matthew Sacks.人民邮电出版社.2014-4-15

“在开发和运维方面,如今的大型网站承受着巨大的压力。随着敏捷方法的实施,问题变得更加严重。管理网站、部署应用、维护运作等任...”

Linux Kernel Networking

《Linux Kernel Networking》

Rami Rosen.Apress.2013-12-22

“”

Cloud Design Patterns

《Cloud Design Patterns》

Alex Homer,John Sharp,Larry Brader,Masashi Narumoto,Trent Swanson.Microsoft patterns & practices.2014-2-17

“”

Python Machine Learning

《Python Machine Learning》

Sebastian Raschka.Packt Publishing - ebooks Account.2015-9

“About This Book Leverage Python' s most powerful open-source...”

Mastering ElasticSearch

《Mastering ElasticSearch》

Rafal Kuc,Marek Rogozinski.Packt Publishing.2013-10-25

“”

Learning Ansible

《Learning Ansible》

Madhurranjan Mohaan,Ramesh Raithatha.Packt Publishing - ebooks Account.2014-11-25

“”

C/C++深层探索

《C/C++深层探索》

姚新颜.人民邮电出版社.2002-12

“《C/C++ 深层探索》试图通过近50节的内容带领读者从各个方面去把握C/C++的语法、语义,并通过分析C/C++编译器...”

UNIX 入门经典

《UNIX 入门经典》

[美]洛费,[美]默显罗.清华大学出版社.2006-4-1

“Unix操作系统是目前一些常用平台(如Mac OS X 和Linux)的基础。本书将讨论Unix的基础知识以及日益流行的...”

0day安全:软件漏洞分析技术

《0day安全:软件漏洞分析技术》

王清.电子工业出版社.2008

“本书分为4篇17章,系统全面地介绍了Windows平台缓冲区溢出漏洞的分析、检测与防护。第一篇为常用工具和基础知识的介绍...”