《高性能计算技术丛书:并行编程方法与优化实践》是“并行计算与性能优化”系列的第2本,主要讲解了如何利用主流的C语言向量化扩展和并行库在X86 、ARM和GPU平台上向量化代码,使软件开发人员跳出烦琐的Intel和ARM参考资料(通常无示例),了解其概要。第1本和第3本则涵盖了并行优化和并行计算相关的理论、算法设计及高层次的实践经验,以及科学计算与企业级应用的并行优化等重要主题,这些内容被许多顶级开发人员视为“不传之秘”。本书作者是国内顶尖的并行计算专家,曾任英伟达并行计算工程师和百度在线高级研发工程师,在该领域的经验和修为极为深厚,他毫不吝啬地将自己多年的积累呈现在了这3本书中,得到了百度深度学习研究院“杰出科学家”吴韧的高度评价和强烈推荐。
《高性能计算技术丛书:并行编程方法与优化实践》8章,逻辑上分为四大部分:
代码向量化优化
本部分主要介绍常见的C语言的向量化库,主要是X86平台和ARM平台的向量化扩展,如Intel SSE/AVX指令集和ARM NEON指令集。
并行程序设计语言
本部分主要介绍目前主流的并行程序设计语言OpenMP、CUDA、OpenCL及OpenACC的并行编程语言或扩展的细节。
主流的并行硬件平台的平台映射
本部分主要介绍Intel Haswell、ARM A15、AMD GCN GPU和NVIDIA Kepler/Maxwell GPU的架构及OpenCL程序如何在这些硬件上执行并行程序的映射。
常见简单应用的向量化和并行化
本部分主要介绍如何使用SSE/AVX、ARM NEON、OpenMP和CUDA等向量化扩展和并行语言来优化图像处理、线性代数应用的性能。