第十二讲   动态规划

    (教材: 第十二章   动态规划)

    1 2 3(本页) 4

    〔例 2〕多阶段资源配置问题(教材中 P150 例 1)设某个工厂在每年的年初可以得到某种原料 100 吨,用于生产产品 A 或 B。一吨原料生产这两种产品所产生的利润分别为 3 万元和 5 万元。每种产品的生产周期都是一个季度。而在一个生产周期结束时,都可以回收部分原料。生产 A 产品的原料回收率为 60%,生产 B 产品的原料回收率为 30%。问应该如何安排一年的生产,可以使该厂全年的利润最大?最大利润是多少?

      该问题可以用动态规划解决。其状态变量、决策变量、直接指标、最优后部过程指标等都可以用变量或函数表示。下面的解题过程完全按照动态规划的要求逐步进行。要注意递推过程,是从后面逐步向前推算的。

     1. 首先把问题分为 4 个阶段: 第 1 季度为第 1 阶段, ,第 4 季度为第 4 阶段。

     2. 每个季度初可以利用的原料数量是决策的依据,以 记第 季度可利用的原料总数量, 是第 k 阶段的状态变量。

     3. 每个季度我们要作出决策,决策变量为用于生产 A 产品的原料数量 。

     4. 每个周期结束后可以回收到的原料数量也就是下个阶段可以利用的原料数量 ,动态规划的状态转移方程:

     5. 第 k 阶段的直接指标是该季度的利润 为

     6. 当第 k 个阶段处于 状态时,从这个状态出发考虑采取最优的决策,使得从 开始直到本年度结束取得最大利润,这个过程就是最优后部过程 。记此时的最大利润 就是最优后部过程指标。

     7. 指标递推方程为

    ,

    其中 max 是对所有可能的决策取的,即对所有满足下列条件的  取的:

     所要解决的问题的就是求 ,其中 。

    1 2 3(本页) 4