首页天道酬勤老股民阿牛(博弈论经典)

老股民阿牛(博弈论经典)

admin 12-20 03:22 272次浏览

股民修养计1028次博弈论第50次复制动态与进化稳定性——二人对称博弈

第50届复制动态与进化稳定性——双人对称博弈

假设游戏端学习速度慢,合理水平低,成员多,游戏动态多次。 博弈方战略类型比率的动态变化是演化博弈分析的核心,其关键是动态变化的速度(方向可以通过速度的符号反映)。 动态变化的速度取决于游戏方学习模仿的速度。 一般来说,学习速度取决于两个因素。 一个是模仿对象的数量大小(可以用对应类型的游戏端比例表示),这与观察和模仿的难易程度有关。 二是模仿对象的程度(可以用模仿对象战略的利益超过平均利益的大小来表示),这与判断差异的难易程度和对模仿的激励程度有关。

(一)在协定游戏上签字

假设游戏侧1和游戏侧2双方达成一致的增益矩阵如下,只有双方同意时才能达成一致,各自得到1的增益,某一方不同意时不能达成一致,各自得到0的增益。

纯粹的战略纳什均衡: (同意,同意),),不同意,不同意) )。

gxdggx上策平衡: (同意、同意) ) )。

同样根据有限理性分析这个问题。 因为玩游戏的一方具有有限的合理性,所以不是所有玩游戏的一方从一开始就找到最佳战略,而是有些候选人同意,有些候选人不同意。

假设在整个组中选择同意的人占全体的x,则选择不同意的人占1 -x。 随机配对时,各游戏参与者有可能遇到同意的对方,概率为x,也有可能遇到不同意的对方,概率为1-x。 那么,如果将同意的游戏方的期待收益设为and,将不同意的游戏方的期待收益设为u

uy=xl(1-x ) o=x

UN=x0(1-x ) o=0

也就是说,选择同意的利益大于选择不同意的利益。

如果玩游戏的一方有基本的判断能力,他就会发现这个差异,即使选择不同意的人也会模仿别人,迟早会改变自己的战略,从而获得更多的利益。 游戏端的战略类型是动态变化的,但实际上这是有限理性分析的核心。 很容易发现,这种动态变化的速度既取决于观察,也取决于模仿的难易程度,还有成功概率等。

x随时间变化。 如果将其作为时间的函数x1,则选择不同意的人的比例为1 -x。 以选择同意的游戏方的比例为例,动态变化的速度是与时间t相关的导数

dy/dt=x(uy-u平均值)

x是选择同意的游戏方的比例,uy-u平均值是超过选择同意的平均利益的利益。

这个动态方程式的意思是,选同意的游戏方的变化率与原选同意的游戏方的比例成比例,与超过游戏方平均利益的幅度成比例,如果

uy=x u平均值=x2

代替上述方程式,dy/dt=x(uy-u平均值) x ) x-x2)=x2-x3)。

很明显,在x=0的情况下,完全没有选择同意的人,也没有模仿的对象,所以这个模仿的速度是0的x>; 的情况下,也就是最初占全体x的人选择了同意的游戏方式的情况下,为0<; x<; 因此,x2x3,相位图如下。

如果最初采用了所有游戏参与者都不同意的策略,即除了x=0以外,该游戏从其他初始状态开始的复制动态过程最终倾向于所有游戏参与者选择1。 所以,x*=0和x*=I是这个游戏的两个稳定状态。

(二)一般的双人游戏

假设协议博弈的一般双人博弈的利益矩阵如下。 并购; 丙、丙和丁; b,

img-caption">

uY = x×a + (l -x) × b

u2 = x×c + (1 -x) × d

U平均 = x×u1+ (1 -x) ×u2

那么就可以得到一个一般的复制动态方程:

dy/dt = F(x) = x(1-x)[x(a-c)+(1-x)(b-d)]

如果 a = l,6=c=d=0,那么,F(x) = %( 1 一 %)%=0,得到 x * =0 与多* = 1 两个均衡解。

(三)应用——鹰鸽博弈

假设鹰鸽博弈的得益矩阵如下表所示,鹰策略即采取攻击型策略,鸽策略即采取和平型策略,其中v>0,c>0。

博弈方2

鹰 鸽

分析过程:复制动态方程如下:

dy/dt = F(x) =x(1-x) [x(a-c)+(1- x)(b-d)]

假设具体数值为c=2,v=12,我们可以得到x* =0、x*=1/6及x*=1三个点:

可以看到:0<x<1/6时,博弈方会向右趋于1/6; 1/6 <x<l时,博弈方会向左趋于1/6 。

也就是说,最终大多数博弈方会以1/6的概率选择鹰策略,以5/6的概率选择鸽策略。即有1/6×1/6 =1/36的结果是双方都选择鹰策略;有5/6×5/6 =25/36的结果是双方都选择鸽策略;而有2×5/6×1/6=12/36的概率是一方选择鹰策略,一方选择鸽策略。也就是说,单个国家,选择打仗的概率是1/6,而选择和平的概率是5/6,现实中只有1/36的概率,双方都选择战争,造成真正的冲突。现实中,鹰鸽博弈可以提示人类社会或动物世界中发生战争或激烈冲突的可能性及其频率。

php如何做到代码的掩藏表明雷士灯具管理系统
囚徒困境存在纳什均衡吗(纳什均衡与博弈论pdf) 博弈论概念(博弈论经典)
相关内容