本书从深度学习与人工智能芯片的研究现状出发,以作者自主设计的TGU深度学习加速器及其配套软件栈为实例,系统性地论述基于FPGA器件的人工智能芯片的设计原理、流程和方法。全书共分10章,分别由深度学习与FPGA基础、 深度学习加速器设计流程、模型设计、训练与量化、架构设计、Verilog实现、SpinaHDL实现、仿真与验证、编译器与工具链等十部分组成。本书适合人工智能、计算机科学相关领域的研究和开发人员阅读。