求该博弈的纳什均衡

求该博弈的纳什均衡,第1张

1纳什均衡(A,B):(进,退),(退,进)
混合策略纳什均衡:-10p+10(1-p)=p0+5(1-p)
解得:各保持1/3概率进,2/3概率退的策略,期望收益:10/3
2设建立成本为X的协调机制,即获益高的一方支付X给获益底的一方
收益矩阵:
B
进 退
A 进 -10,-10 10-X,X
退 X,10-X 5,5
则:建立在混合策略下的纳什均衡
-10p+(1-P)(10-X)=Xp+5(1-p)
p=1/3-X/15
期望收益E=(1/3-X/15)X+5(1-1/3+X/15)=-X^2/15+2/3X+10/3
令E>10/3 解得X=0、10
所以只要0<X<10时 期望收益就会增加
当X=5时取得极大值
E(MAX)=5
所以当X<10时通过建立协调机制能提高双方福利水平。
有不懂到我空间留言

博弈树看纳什均衡:纳什均衡和逆向归纳策略都是同一个,即与支付向量(1,3)相应的策略组合(决策1,决策3)。

博弈树探讨一下难度较大的棋类游戏程序,用这些程序来同人或其他程序对弈。有些程序是把计算机精心设计成一个棋盘,人们可以在其上对弈。这种程序更接近于系统模拟的领域,而不属于人工智能的范畴。此处所要介绍的却是让计算机能够“思考”如何下棋。

简介

纳什均衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什均衡。

该博弈矩阵的纳什均衡为0,200

甲 40,50
-10,40
0,200
0,150
这种没有上策均衡的博弈,应该用严格下策消去法进行选择纳什均衡
甲方(都好左边)首先排除-10,即-10,40被消去;再排除0,由于有两个0,所以要又要从乙来排除,应该先消去0,150,再消去40,50(因为150和50都比200小)最终纳什均衡为0,200
如果从乙方开始排除,则直接依次排除-10,40;40,50;0,150(因为40

在一个Normal form game里,是一定存在至少一个混合策略纳什均衡的。Normal form game简单地说就是常见的那种可以画出MN的矩阵的game。证明如下:定义一个game:n个player,用i来表示;每个人有有限个策略,player i的策略集用表示,里有个元素;表示player i出第j个策略的概率,,;定义效用函数,是一个维simplex,代表了player i所有可能出的混合策略,是笛卡尔积。这里有一个非常重要的假定:是concave函数,可以理解成边际效用递减的效用函数。对于player i来说,我们把其他所有player的策略写成,所以player i的效用就是。定义best response,也就是给定别人的策略,player i的最优策略:;所以best response是一个correspondence:。注意:给定别人的策略,player i的best response可以是一个集合(不止一个best response)。可证是convex的。把所有人的best response写成,这是一个给定所有人的策略,每个个体都觉得更好的策略组合,我们可以写成,这是一个自己到自己的correspondence。同时可证是一个convex-valued correspondence。是n维欧几里得空间的子集,满足非空、紧(compact)、凸(convex)的性质;是一个自己到自己的correspondence,满足非空、凸(convex-valued)、closed-graph。根据Kakutani fixed-point theorem,有一个不动点,即存在满足,也就是说在所有人的决策是的情况下,任意player i都觉得,如果其他人策略不变,比较简单的game都可以用求出best response correspondence的方法解,这应该包括在你会的两种方法内。但比较复杂的或者决策集是连续的game,一般没有固定解法,很多情况下你找到某个game的纳什均衡就可以发paper了(比如Levitan & Shubik, 1972)。

如果是这道题目。。。个人在一条均匀的沙滩上设店,其中纳什均衡是两个人都在中点 如果这个时候,有三个人要开店
关键点在于三个人是完全相同的且全部足够理性
只有保证每个人平均能覆盖1/3的顾客的解才可能是NE
所以没有NE
完全相同是说三个人是对称的
不分顺序的,这就导致最后的解只能有两种可能
1 三个人在同一点开店
2 三个点的地址都不同
这样就排除了两个店在同一点第三个店在另一点的情况
第一种情况不可能因为只要一个店稍微偏离一点就可以获得更高的利润第二种情况也不可能,由对称性很容易可以解出此种情况下的三者位置分别为1/6,1/2,5/6。但是很容易
验证,这不是NE
上面搜的人大论坛,>为什么混合策略((3/7U,4/7M),(3/7L,4/7M))中不包括D和R?
你应该还没弄清楚什么是混合策略,这里面是包括D和R的,他正规的书写应该是
(3/7U,4/7M,0/7D),(3/7L,4/7M,0/7R)
求不出正确的解?
表示看不懂你说的是什么意思。题目要求你求出什么解?


欢迎分享,转载请注明来源:内存溢出

原文地址: https://www.outofmemory.cn/yw/12697432.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-27
下一篇 2023-05-27

发表评论

登录后才能评论

评论列表(0条)

保存