关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
" \4 V: R% J( E: Q9 y
0 `* x8 ]7 j8 M2 v$ H严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
' `. q3 ^. u/ r* y9 p- d7 L4 k7 }  以下三个定义:. Y3 ^( k" X1 n( A8 U: Z
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 5 |$ k7 w9 o9 I2 Z% [$ e
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% L# I6 b( F2 `8 V: C, h1 d5 r; h/ n  所谓的双方优势策略则是指双方利益总和最大的策略。  
6 V  p' u7 w# V" S" ^* H: A- U$ |[编辑本段]严格优势策略举例分析- n4 x& T) X9 @" f- ^
  一、经典的囚徒困境 - C* `: w4 m2 h  m! U4 M5 _) R: E. a
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ H) J$ y8 w" i  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 C$ r: C( Q  J& Y2 m) r, P  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 ]! r+ \# E" ^$ ]2 p6 ^3 Z
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
, g( F5 w) q9 v( G: w  若二人都互相检举(互相“背叛”),则二人同样判监2年。
) N) K& f$ P6 }5 Q6 y9 [  6 o$ o2 z1 N; Q/ e2 P0 z+ m
用表格概述如下:
8 e5 o" @4 y1 ?
1 c* S: E& w, a" e3 p: j6 z& F    甲沉默(合作)  甲认罪(背叛)  
0 M) {, z- a' x) x$ W0 M. q乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
4 \  v' T- a/ t! {$ F2 V乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  0 [' H0 ]2 ]; z2 G1 r
# l* A1 c6 \7 \. y! U6 {
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 v+ E4 R% r7 ^7 N# h5 n# Z
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
) s7 @, f! Y5 L1 ^  T  若对方沉默、背叛会让我获释,所以会选择背叛。 8 Y: _/ ~- a: ~
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% C' G7 t  L9 q6 |0 U) N  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 : @6 `" d) ^/ j1 j- [+ G
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 2 u0 v# f, `8 W. T
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。/ P) ]& O  }- J% N) N+ A
[编辑本段]二、智猪博弈理论7 z, t) L% Q& x! y% _6 Q
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% I. T/ z/ A" v$ c' {  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 / f& X  `) }, T) X
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" T+ s: ?4 C- n5 u- L  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 d1 ]4 V- K6 k0 N
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 / j) O4 M; K; e. L8 J( p6 J& \
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 L3 z* \6 l( f8 s& _7 c) c% _  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 ^$ w1 C/ W5 W# q  L  E
  
8 Z9 [8 F& K4 w1 j三、关于企业价格策略0 b7 F( `% d+ W  u5 o$ X! T

  t; l4 @. M. A0 W" [0 s7 Q  
3 _5 P) w  }- v3 y# i' T9 G( A- J; Y  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
& n& F5 @* m% k5 q  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
/ f; ^8 U1 j$ Z( [; ]7 f  s: X, \  以下三个定义:: ^% {7 \6 ~* w) p
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 $ T. A$ [% A$ V% M0 a7 x& S
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( |4 F# B) h7 N$ [4 H4 v
  所谓的双方优势策略则是指双方利益总和最大的策略。  
) T# \! Z( n+ j2 A7 C& {$ w[编辑本段]严格优势策略举例分析" r4 q5 o" j) H
  一、经典的囚徒困境
4 D, B3 }8 r- z  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
& d" F5 p4 G  ]9 j% s  j. l4 }& ]  L  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: + }1 \4 q9 p0 G) a" E- v
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; L% b9 k8 T  }  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 / N2 c& A- s3 W/ ]$ [6 @9 ~
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
) `+ @3 J* d5 B9 b, s+ K" z  2 H: \9 A0 l: B0 j9 ]  V: z7 E
用表格概述如下:" l+ G3 u* b0 N, f8 [" o

8 V6 b, m. I" ]" h, i( F$ _0 R    甲沉默(合作)  甲认罪(背叛)  
6 R# |6 I3 l5 o乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
1 _1 U2 b$ F2 D- o$ K2 f3 E乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  / x" _1 b6 g/ T9 M

/ o2 y8 u2 r9 X7 v2 K) y" u  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
( o2 l$ ~* Q; G# ^  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % J7 |: a6 ^. _( ~# }* u& V
  若对方沉默、背叛会让我获释,所以会选择背叛。
6 m8 e7 f: w0 }3 ^8 c  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 5 Q* b* ~( D' e" q* B
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
" x" _) j3 f5 \/ G2 S9 A' I& c5 f  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
1 F$ U8 Y: O8 A# Z( G4 B  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。. u  ^/ }( u1 |6 `8 [; B$ U6 h
[编辑本段]二、智猪博弈理论$ \# r, R( i: d4 H5 U$ R* N/ b. u
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。   u4 V/ o8 |8 _# ~1 L
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 * T( e* H! s* f$ U
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 J6 |: y0 ?' r1 O' v/ u8 z; I3 y! @* m
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
- \$ b# T) E: @. A  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
- a# X3 h4 U& O& l: R: s) r  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) _2 F4 Q$ e& o1 v( ?4 Y  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, H7 b! ]- g& M% C  
! Q1 t: V/ d* q* Q) S7 B' ~三、关于企业价格策略
/ Q8 [7 o( }0 ^' e0 x# x
7 P7 }9 M/ T4 Q; [) W' p  # S0 y8 {3 s3 p- {; r* X0 T- V
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
% e# L, W9 ?0 }! O' G7 P* n  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);- p% S; I2 ?! A
  以下三个定义:
; t5 T7 ~8 [4 Z/ e) o  P1 ^  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 0 m# E2 D: o9 D
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
. ^1 ^0 `$ o0 d# t/ G  所谓的双方优势策略则是指双方利益总和最大的策略。  
& x  e( E( @. {5 D: @- l% c4 r[编辑本段]严格优势策略举例分析
' `& D* Z9 H  X6 \5 b3 o  一、经典的囚徒困境
3 f; @4 D" d) G; v' m  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 q( Z) n# O  l! d, q& p; d' U  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
/ K, R! c" k) ], [2 b; `5 S3 q  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
6 I* w/ t  e! z  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
3 [9 y' M4 c  a1 I$ k- h  若二人都互相检举(互相“背叛”),则二人同样判监2年。3 b$ R( ~# N7 {4 ]* b! f1 G
  7 p' ?- n1 `8 Q; [" t* q+ x: z% P  h) C
用表格概述如下:5 G9 o; Q# o$ [0 L# q4 h6 f

: P+ S+ H+ h- F4 U( M; a+ w    甲沉默(合作)  甲认罪(背叛)  
5 z- }7 ?3 }: E# [6 `乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
/ o1 K1 s. w" f$ A  u# F9 S: i" c/ A乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
; W$ o" I0 }! h# O- P/ `, C0 w' p; w* B) z+ l
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 4 J# M7 P/ _/ F  W: `
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
: A) r$ ]4 t% |8 D6 G7 E  若对方沉默、背叛会让我获释,所以会选择背叛。 , D9 k* f3 ]7 B
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 # U- f  U6 q* z1 ~) n6 T" ?% [* B4 F
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
. ~0 M3 o) z2 G+ Z3 |; y1 Z8 D" l  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; n' ?* Z5 c; B; D  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
: Y2 A# m! C5 `# D; i[编辑本段]二、智猪博弈理论9 H0 W% [: {9 A( K" R, s2 F
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* U3 M: C" [- E$ _  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! k, |* J9 N) _, i! ?# k- h
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
( L( ^2 D) E9 ?' s2 w  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
2 q/ a  O' x- n' K1 [  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* Z6 U- n8 q. ?) A  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 9 C6 v8 [, K6 ]
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
" V4 t4 ?1 b, h+ E9 X, H  9 g, l/ d" k$ T5 d8 O2 {3 C, t7 k
三、关于企业价格策略
( W, H+ y! z- U; ]" Z2 _9 A4 ^/ C2 W' c
  ( G- X! g& p8 y! b' z
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
% o6 t$ `- ?" ^; s  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);7 d6 K9 ]1 S: \; p
  以下三个定义:
1 Z; `. J9 I' d( b5 L. ?  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
! R4 c; Y, x7 b: B4 X; r. u7 T; |. E# H  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 F  v" ~* N8 M  [; _, c
  所谓的双方优势策略则是指双方利益总和最大的策略。  
5 ^3 u" b" ]9 X9 @# a! }[编辑本段]严格优势策略举例分析
2 t5 h& T1 F* a* ~! L  一、经典的囚徒困境 6 x5 `% S8 d* [0 s( ]2 ~" i
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
1 a  K. I" Y8 p1 |2 L: n3 H  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, x6 H% v) o5 z3 S( y" O  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 `# B4 J9 P( W: S/ J
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 8 ^: B+ H7 ?  o- M: Z5 @2 t4 N: ?/ ?. I
  若二人都互相检举(互相“背叛”),则二人同样判监2年。  K- _( Q( W% i# ^* \
  7 ~0 m4 ?" k6 F) `
用表格概述如下:
2 w% {, f# T% u- e7 p
. N' n" m: r3 r- ^    甲沉默(合作)  甲认罪(背叛)  
9 M# Y1 l( c4 _9 Q% E# @8 P乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  7 l1 D. v- Q; ]1 Q  v9 @
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
( D0 R$ c2 z0 Y- ~/ c. o; @2 M" q2 K* l- D
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
0 y% L* k2 w! E2 U  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 v1 h' }8 P0 ~0 s: ?; D' V$ l0 I3 e
  若对方沉默、背叛会让我获释,所以会选择背叛。
0 p8 b& P7 A/ \, }& L# h4 |  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" u7 [. X5 [7 N0 T: z- h  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 _/ p" B3 y* z2 [8 `$ R
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
9 b7 n0 i: x1 X- N! }' d" I  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。2 S8 V3 f7 n  E2 Y( u
[编辑本段]二、智猪博弈理论
9 `9 V' i' b9 q/ F: v+ ]  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 [* S4 K* X/ ^+ ?% O5 d  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ' l$ `1 `- r- h7 a& l
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. n$ h2 ]& l; h  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 1 }/ ~3 p8 k* [7 y9 x( A" H
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
( t% H. ]" b; o' H  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( W- q, ~( f" c# ~  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。5 i' t1 N% J+ s. G+ g" f2 K3 H
  # x6 h* l4 ~3 ^# W
三、关于企业价格策略) ?( E9 V) K( Z* b- X1 ^* K6 k

% N9 s% E3 E8 t4 ~( D  3 N% n7 o2 B" z* S' W4 H2 D6 b
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? & \4 a4 r! S$ W% z9 {7 u" a
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )