《强化学习与最优控制(英文版)》的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和优控制来解决,但它们的解决方案在计算上是难以处理的。《强化学习与最优控制(英文版)》讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。《强化学习与最优控制(英文版)》的主题产生于优控制和人工智能思想的相互作用。《强化学习与最优控制(英文版)》的目的之一是探索这两个领域之间的共同边界,并架设一座具有任一领域背景的人士都可以访问的桥梁。