第十二讲 动态规划
(教材: 第十二章 动态规划)
![]()
三. 动态规划解题的简单例子
要通过简单例子理解动态规划解决问题的过程和步骤。
教材中的例:用动态规划方法求下图中从
到
的最短路。

(1)
划分阶段: 从
向
方向每前进一步我们称为一个阶段。从图中可见, 整个问题分成 5 个阶段。
(2)
确定状态变量:每个阶段开始时处于一个村镇,把第
个阶段开始时所在的村镇记为
,称为第
个阶段的状态变量。
只可取
;
可以取
、
或
;
可以取
、
或
。每个阶段要选择下一步布线走向,称为该阶段的决策,记为
。例如当
时,
可以取
、
;当
时,
可以取
、
或
。
(3)
确定状态转移规律:每个阶段开始时处于一个村镇
,经过选择后将到达另一个村镇,这个村镇也就是下一个阶段开始时所处的村镇
。
和
以及
的关系按它们的含义可以写成:
。
上述方程的意义是:由上一个阶段的状态和上一阶段的决策可以确定下一个阶段的状态。
(4)
确定直接指标和最优后部过程指标:
的最优后部过程指标
就是从
到
的最短路径。直接指标是指该阶段所作决策的指标,当第
阶段的状态变量为
、所作的决策(即下一个村镇)为
时,直接指标就是村镇
与村镇
之间的距离
。
(5)确定最优后部过程指标的递推方程:对每一个阶段的每一种状态
,它到
的最短路径
可以表示为一个递推方程:

上述 min 是对在状态
下所有可能的决策取的。上面大括号中的公式的意义:在状态
下,采取一个决策到下一个状态
,其直接费用是
,到了状态
后再沿着从
到
的最短路径到达
,这个决策所化的代价是大括号中的公式。而从在状态
下所有可能的决策中选择最小者就是从状态
到
的最短路径
。为简便计,我们研究下面的例子。
〔例1〕求图中从
到
的最短路:

我们把例子中的各种量列成表格:
|
阶段编号 |
状态变量 |
可取状态 |
可取决策 |
直接指标 |
最优后部过程指标 |
|
1 |
|
|
|
4 |
9 |
|
|
3 |
||||
|
2 |
|
|
|
2 |
6 |
|
|
4 |
||||
|
|
|
3 |
7 |
||
|
|
2 |
||||
|
3 |
|
|
|
5 |
5 |
|
|
4 |
4 |
|||
|
4 |
|
|
- |
- |
0 |