纳什均衡

来源:百度知道 编辑:UC知道 时间:2024/09/24 14:23:31
一群赌徒围成一圈赌博,每个人将自己的钱放在身边的地上(每个人都知道自已有多少钱),突然一阵风吹来将所有的钱混在一起,使得他们无法分辨哪些钱属于自己的,他们为此而发生争执,最后请来律师。律师宣布了这样的规则:每个人将自己的钱数写在纸条上,然后将纸条交给律师;如果所有人要求的加总不大于钱的总数,每个人得到自己要求的部分(如果有剩余的话,剩余部分归律师);如果所有人要求的加总大于钱的总数,所有的钱都归律师所有。
写出这个博弈中每个博弈方的策略空间和支付函数,并给出纳什均衡。纳什均衡是唯一的吗?

纳什均衡定义:
  假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。

  纳什均衡经典案例:囚徒困境
  (1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。)
  假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。表2.2给出了这个博弈的支付矩阵。
  表2.2 囚徒困境博弈
  ——————————————————————————
  ┃ B ┃ B ┃
  ————————┃————————┃————————┃
  ┃ 坦白 ┃ 抵赖 ┃
  ————————┃————————┃————————┃
  A 坦白 ┃ –8, –8 ┃ 0, –10 ┃
  ————————┃————————┃————————┃
  A 抵赖 ┃ –10, 0 ┃ –1, –1 ┃
  ————————┃————————┃————————┃
  关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他