第十五讲    对策问题

    (教材:第十五章  对策问题)

    1 2 3(本页) 4 5

    〔例 3〕(教材中田忌赛马)将田忌和齐威王的各种决策组合及齐威王净胜的场次列表如下。

     

    齐 威 王 出 马 决 策

    123

    132

    213

    231

    312

    321

    田

    忌

    出

    马

    决

    策

    123

    3

    1

    1

    -1

    1

    1

    132

    1

    3

    -1

    1

    1

    1

    213

    1

    1

    3

    1

    1

    -1

    231

    1

    1

    1

    3

    -1

    1

    312

    1

    1

    1

    1

    3

    1

    321

    -1

    -1

    1

    1

    1

    3

    从表中容易验证田忌赛马满足上述随机决策的所有特点。特别从表中可见,齐威王的任何一种决策,田忌都有取胜的决策。由此还可推出,如果时间上双方决策可以有先后,对胜负结果有很大的影响。

     

    四. 随机对策的最大期望解

    我们应用概率论中数学期望来计算重复进行对策活动的平均结果。

    在田忌赛马的例子中,我们假设双方采用每种策略的可能性都相同。这时,各种对策的组合出现的可能性都相同, 即概率都等于 。 由表中齐威王的净胜场次为 -1 和 3 的概率都是  , 净胜场次为 1 的概率为  。 于是齐威王的期望净胜场次为

    其含义是:齐威王和田忌若按随机对策方法经常赛三匹马(三场), 则齐威王每次平均要净赢田忌一场。我们也可以计算齐威王某种出马次序净胜场次的期望值。 假设齐威王采取的出马次序为 123 ,田忌采取六种出马次序中每种出马次序的概率都是 。此时齐威王的净胜场次为 -1 和 3 的概率都是 , 净胜场次为 1 的概率是  。 于是齐威王采取出马次序为 123 的期望净胜场次为

    。 

    同样可以计算田忌偏爱某种出马次序时的期望净胜场次。 假设田忌采用出马次序 312 的概率为 , 其余各种出马次序的概率各为 , 并且假设这种偏爱已被齐威王识破。此时齐威王最佳的出马次序为 312,我们就假设齐威王的出马次序总是 312 。齐威王每次赛马净胜场次的期望为 。

    即平均每 5 次比赛齐威王净胜田忌 9 匹马。 这说明, 和无偏爱地随机选择对策的情况相比, 田忌偏爱某种出马次序可能会造成更大的损失。同时,当一方知道了另一方采用各种对策的概率,应该选择使本方“收益”最大的对策。  

    1 2 3(本页) 4 5