第十五讲 对策问题
(教材:第十五章 对策问题)
![]()
〔例 3〕(教材中田忌赛马)将田忌和齐威王的各种决策组合及齐威王净胜的场次列表如下。
|
|
齐 威 王 出 马 决 策 |
||||||
123 |
132 |
213 |
231 |
312 |
321 |
||
|
田 忌 出 马 决 策 |
123 |
3 |
1 |
1 |
-1 |
1 |
1 |
|
132 |
1 |
3 |
-1 |
1 |
1 |
1 |
|
|
213 |
1 |
1 |
3 |
1 |
1 |
-1 |
|
|
231 |
1 |
1 |
1 |
3 |
-1 |
1 |
|
|
312 |
1 |
1 |
1 |
1 |
3 |
1 |
|
|
321 |
-1 |
-1 |
1 |
1 |
1 |
3 |
|
从表中容易验证田忌赛马满足上述随机决策的所有特点。特别从表中可见,齐威王的任何一种决策,田忌都有取胜的决策。由此还可推出,如果时间上双方决策可以有先后,对胜负结果有很大的影响。
四. 随机对策的最大期望解
我们应用概率论中数学期望来计算重复进行对策活动的平均结果。
在田忌赛马的例子中,我们假设双方采用每种策略的可能性都相同。这时,各种对策的组合出现的可能性都相同, 即概率都等于
。 由表中齐威王的净胜场次为 -1 和 3 的概率都是
, 净胜场次为
1 的概率为
。 于是齐威王的期望净胜场次为

其含义是:齐威王和田忌若按随机对策方法经常赛三匹马(三场), 则齐威王每次平均要净赢田忌一场。我们也可以计算齐威王某种出马次序净胜场次的期望值。 假设齐威王采取的出马次序为
123 ,田忌采取六种出马次序中每种出马次序的概率都是
。此时齐威王的净胜场次为 -1
和 3 的概率都是
, 净胜场次为 1 的概率是
。 于是齐威王采取出马次序为
123 的期望净胜场次为
。
同样可以计算田忌偏爱某种出马次序时的期望净胜场次。 假设田忌采用出马次序 312 的概率为
, 其余各种出马次序的概率各为
, 并且假设这种偏爱已被齐威王识破。此时齐威王最佳的出马次序为 312,我们就假设齐威王的出马次序总是 312 。齐威王每次赛马净胜场次的期望为
。
即平均每 5 次比赛齐威王净胜田忌 9 匹马。 这说明, 和无偏爱地随机选择对策的情况相比, 田忌偏爱某种出马次序可能会造成更大的损失。同时,当一方知道了另一方采用各种对策的概率,应该选择使本方“收益”最大的对策。