本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 9 a- L1 m+ L' J# F7 h
. y( T( |9 w$ f! M' j% W
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);: U4 ~, B8 S8 M
以下三个定义:
# i! ^2 x1 T. v/ L 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 / Q; T3 i+ k/ ^7 \+ x' b5 I1 G( E+ C
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( _# j: A4 V" N; Z
所谓的双方优势策略则是指双方利益总和最大的策略。 7 M3 o$ s) k7 \4 [1 Y
[编辑本段]严格优势策略举例分析# {" G0 X0 T4 ^! a: z4 O
一、经典的囚徒困境
+ H( z4 J- K: C, E* C5 { 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ' R8 }, L( _4 ~* c: E! y
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 l" U3 N9 [& L1 I. t/ b% M3 s0 X 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 z0 v1 \4 H# j, W( z) l
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* w1 p$ Z+ r# k- u. H, U: y) ^ 若二人都互相检举(互相“背叛”),则二人同样判监2年。
* ~% T l' Y9 L2 x/ E7 Z: b
" ^( k* H& F5 x用表格概述如下:9 c* E% S' d; V' Y- a
" Q& G4 }; ~5 g; a! k& X3 o' I
甲沉默(合作) 甲认罪(背叛)
1 q, W' S/ U% e& M乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
0 {. O. `! X6 }, W乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 0 _0 k2 K$ Q4 k# n! d
# K4 ?5 s2 L( \2 V, e+ z" _" ]% g3 V 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. i# X8 T+ D. z1 p 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ; N, J) i! P3 K; @
若对方沉默、背叛会让我获释,所以会选择背叛。 1 B) }7 S& ]! Z2 Q
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + ?2 ~! e' p1 s* r
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 I/ U/ y2 v2 C4 e 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* [* q( C5 o) D# ^; ^ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
# a J& w5 `+ F7 D; ^ a[编辑本段]二、智猪博弈理论+ S4 e* U3 ~% }% j. C
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 $ D( i0 g# ^& z
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 , s+ g7 Q+ p! ]8 M( Y+ }
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
$ a" H3 F( ~( X) H! U 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % x6 j( ]% `6 \* U# B+ ~
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
6 O: ^. ^) E4 _' W+ }6 F+ O 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! A" N7 v i/ T! m( o 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. i/ l+ Y' R" P- L& q' E, i! ^
, K! {6 J% J F( o" i三、关于企业价格策略, z) E% z( p$ g# U6 L; @
/ e8 t% F' x: x+ a
1 I3 B. D( Y* c+ Y& B( s 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ' B# E& \) b2 X
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);! C3 d; l- ^+ W" _ _) d' U, H
以下三个定义:
/ s3 _: q& \0 @4 g 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 5 W# x. \! j V+ n
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 5 `$ \% E& ?0 ?; f2 p
所谓的双方优势策略则是指双方利益总和最大的策略。
3 \9 N+ Y: j9 B- B6 H3 a1 V[编辑本段]严格优势策略举例分析
, @0 g, F% _1 m3 O3 e' r 一、经典的囚徒困境 1 M b0 M% _; D! q+ D9 R5 S
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: * a) t, W, e" I6 r% X }2 a3 I" z
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 9 G$ m$ r1 ~" E2 f
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" L) Y; u* }) Q% A. k! }- d+ E- e5 R 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
! K7 r) q9 d' F3 l8 z 若二人都互相检举(互相“背叛”),则二人同样判监2年。 J8 X! i) N' r" y: W* H( N0 [. K$ \# s
& Z7 {, q& B( g7 A* K1 E用表格概述如下:: B w5 v* B' ?0 _9 B
4 f! U# G& q; |
甲沉默(合作) 甲认罪(背叛) 8 `) ^2 O1 C/ g
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
0 B$ `% `& b u* b7 ^7 T6 B0 D4 V乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 5 S' Q( S- _0 Z7 Q' K: A U
8 g* I) r7 G' Q2 G* C' }" U
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 # `% w( W: D q. q0 W5 \ E$ l
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
2 V9 s% g$ N' p/ [ N! C7 f 若对方沉默、背叛会让我获释,所以会选择背叛。 0 W W V* X$ P1 @. W2 G0 h5 N% z
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
# X6 w' g J5 l) y/ x/ ] 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ; S. p/ M; D# B5 O
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) o% Y6 k4 j2 |
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。0 n+ d0 [2 s) ?! \$ U- v
[编辑本段]二、智猪博弈理论5 X. h8 S& g4 z
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 % U' f& l$ w' J- Y
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
' j9 U; r2 d/ L 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
N) m$ y8 B6 J+ l$ C3 b( O9 J0 e 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 - M- r& ?6 d$ v1 _. p5 K
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 9 J' N, h5 a! z, N4 S
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ' e+ J l& N1 t! L
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。9 k# H" {1 C; O1 w
# t1 ?/ S+ E/ A$ z$ j9 C; k三、关于企业价格策略
5 ?7 Z$ H z! B' Q2 R3 E: e
2 M; d$ E* U) ~% s5 s* L( N
* I# o3 ~. d- t/ C 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
1 r/ W1 U5 U- W5 g- J1 Z6 F! R. m 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);) B2 s/ f" z+ O) G% x3 e
以下三个定义:; S7 b4 Q- n( R* o+ b) n
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 6 p" c8 f9 z7 q6 `4 r. M
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
2 a+ q* e4 V! h 所谓的双方优势策略则是指双方利益总和最大的策略。 , j2 Z! Z2 k! K, n$ ^8 I
[编辑本段]严格优势策略举例分析- x7 A, t: a0 e' Y, d
一、经典的囚徒困境
# r$ O, R, {, R5 S 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
1 o# J0 k: u2 }) }- s 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: % y! w9 y$ k; w2 m; b
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 " g+ j8 c6 l1 ^1 C B
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- D5 V0 c4 v! _0 l) n2 f 若二人都互相检举(互相“背叛”),则二人同样判监2年。
$ {" i& B! h2 r5 P2 F
6 y8 n6 i( [8 W! {9 S用表格概述如下:3 q m' w( Z4 j* O
$ ] w# {$ _& C# Z; G. Z. v
甲沉默(合作) 甲认罪(背叛)
: s, b4 { S6 [ ^( l乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 - ?( O# E2 ^5 K. ]& L0 Q( ?
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
1 E" S0 T' O3 L$ M3 h/ @' D4 ~, V
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
' Y/ x5 j, F& o: z9 _) l4 e- o 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
6 k3 _9 @" P) c6 P/ ], m 若对方沉默、背叛会让我获释,所以会选择背叛。
0 u! K7 G v# c ^ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + ~' T3 Z* B U1 U/ Z
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ) C8 |1 t3 u* R1 b# v8 e. L
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
: b5 a* H( w& W, c5 T 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; W" d5 i6 z( Y& h# C[编辑本段]二、智猪博弈理论
7 ?. s. s6 W( \* W4 g4 i1 ] 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% _6 `7 k3 F5 y! B 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 1 m& B; }" X; p4 {( N+ E1 r/ u& F
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
x v+ |1 A( v; M 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 7 l) M9 k R" G
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) |3 I$ V9 Q* W; f
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 i: o5 B+ c' N+ U9 m
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。+ F; b7 u' G1 O1 o
+ X* P E! \" K% G
三、关于企业价格策略# V0 ~) S! P+ ?- }+ s
5 N# |: d; x5 E/ g
9 R4 t. g, {2 X' E' c
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? " S! @/ Y2 Z/ i" r! a: N: A
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
' s2 v. | t6 Q 以下三个定义:
9 A; R- c5 ~+ Z7 U ~2 w0 @- q 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( [. ^0 p- m4 ?. @$ S4 A 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ! t. \; ]; h7 W, V- {
所谓的双方优势策略则是指双方利益总和最大的策略。 . v; P$ `5 C! S% W/ H
[编辑本段]严格优势策略举例分析
" g% u1 r+ b/ z8 x2 k2 X 一、经典的囚徒困境 , j m* t- v4 V' z( m/ V" p
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
% r8 x! P2 W% P ?* P 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 e4 [7 M0 q( f* [" F
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ; M. F% \9 O- b5 j3 \
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 4 S, W _, o) a# t
若二人都互相检举(互相“背叛”),则二人同样判监2年。
& g$ W( ]3 s9 g2 p) ^ ) Q6 m- P& E8 T" j. Q9 l+ Q
用表格概述如下: m+ b8 ~3 y( T' E5 A% n: E
2 s' M* |/ u/ | P( W+ M; t9 w
甲沉默(合作) 甲认罪(背叛)
1 _$ {+ q4 S2 B乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 & L3 C1 C4 E4 u5 m( t
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 p4 z8 S m( v2 U
9 t5 _9 {( v' x/ F1 O$ i: m I# J 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 u( n1 a) T& B( G% L! q 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ) b9 V4 h& L- S* N
若对方沉默、背叛会让我获释,所以会选择背叛。
5 k* \% F/ @' l! ]4 F3 A! m 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- k1 p" @8 |. t- g- Y4 b 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 % F5 \6 n- {+ t
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
! }9 n4 D1 G# w7 l5 p; q 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
/ S) n; \- d& p/ C2 x[编辑本段]二、智猪博弈理论
4 H: l- O4 F4 m, p6 f) t 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 # I7 Z$ e) B: h, ?4 l
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
0 f" f. }6 [3 F1 O' ~) W2 L& S( b i- h( Q 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
b3 {: E: ^; z8 @; Q6 \3 `2 N% M" q) M 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 & G) r, f+ }! F# z4 G' Q; Y( x
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
- n% R( g2 i" X" p6 ]1 q3 [8 p 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
7 _8 r {5 y- N* j. k 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。1 N e% Y4 f+ {( Y6 i8 m. {' `
% N# n$ f5 q+ J" O5 V+ D/ p# t) d
三、关于企业价格策略
8 a- Y) j; k+ C- r. H, P/ R) C
: a; r: c2 Y( W
+ r; j# p- }% w 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / ?4 l( f* v: M
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |