博弈论冯诺依曼书

2023-12-26 17:05   geyange.com

博弈论中的名句

博弈的解——混合策略

1.零和二人博弈重中之重是猜测对方的策略。

2.实际上我们需要了解局中人在同一对局中的策略,而不是一连串的局中的策略。

3.如果局中人的策略一样,那么结果也会一样。

4.采用同样的策略,局中人不会有任何损失,也能让局中人怎么样都赢不了。

掌握“情报”——博弈的致胜法典

当博弈赛局中的人进行选择时,他究竟掌握多少有关的、具体的情报,是博弈中的一个重要特性。

不可传递性

反面信号是误导博弈中对手的信号。

一人博弈:一场“斗智”之战

在没有利害关系的情况下,不会出现博弈。

“偷鸡”:“虚张声势”促成功

1.选择加价或叫高价,以此达到一种自己手上握有强牌的假象,打乱对方的策略,用这种方式可能用弱牌赢过对方手上的强牌。

2.采用这种策略具有风险性,由于其中的一个局中人无法判断出对手是否会顺着自己的方向走,所以这种“叫价”的方式自身具有冒险性。

3.“偷鸡”是博弈中的一种具有防御性的策略。

你真的会打扑克吗?——“叫价”的艺术

假设双方博弈比值明显差距大,那么这就说明博弈的风险和冒险性极高,相反,那么这就意味着此次博弈较为安全。

“优胜劣汰”:二人博弈中,到底谁为鱼肉

对整个博弈的情况有简单的了解,便能够做出对自己有利的策略选择。

国际象棋——有智还有谋

倘若对手的行为是不合理的,那就意味着不会给另外的局中人造成不利。

你的“策略”决定了“对战”结果

“合伙”的可能性的出现是博弈中最有意义的策略。

“配铜钱”升级

1.利用一切策略,在一般化的方式极大程度解决了那些非严格确定情况下的难题。

2.若策略被对方猜中,那就意味着他会遭受一定数量损失。

3.为了保证自己的意图不被对手发现,要在策略的选择上尽量保证随机选择不同的策略,因为能够确定的只有若干策略的概率,而且这是一种十分有效的博弈方式。

理论相悖?——单独博弈中的可能性

在博弈刚开始的时候,我们几乎观察不到任何有价值的信息。

对称的对立面——不对称分配

1.在三人博弈中,局中人1若想偶合,便需要他将额外的收益给另外一个局中人。

2.假设局中人1,在局中1和3形成的偶合中的收益为1/2+e,然而2和3形成的偶合中,最终获得的收益是均分的。在这种情况中,假设1坚持要保留他的额外收益e,那么最终2和3都不愿与其形成偶合。

3.在三人博弈中,若为了争取合伙关系,可能要将自己的额外收益支付给另外一个合伙人。

“追根溯源”:本质与非本质博弈

不合伙就是非本质博弈,合伙就是本质博弈。

不同的声音:完全情报的“反对意见”

当我们建立了一套自认为普遍有效的理论时,必须能够承担所有反对意见的能力。

寻找“可解”的n人博弈

每当博弈的局中人增加,局就会发生本质上的变化。

经验就是一劳永逸的理论先导。

零和博弈

有一胜一负的博弈便是零和博弈,双方的得分为1+(-1)=0。这个游戏的总成绩为0。

当时世界上的某个地区或者国家的资源增加时,也就意味着别的地区或者国家的资源在减少。

通过有效的合作能达到双方皆大欢喜的结果,但是零和博弈游戏走向双赢是一个比较复杂的过程,不仅需要双方真诚地合作,还需要遵守整个游戏的规则,才有可能出现双赢的局面,若是不遵守这种规则,最后承担风险的还是参与者自身。

重复博弈

当所有博弈仅仅进行一次时,人们往往更加关心它的最终结果;假设博弈会进行多次,那么人们的注意力将会变成最终的收益,甚至会舍弃眼前的利益,只为获得更加长远的利益,进而根据情况做出不同的策略选择。

重复博弈不能像静态博弈那样只考虑自身或者当前的利益,而丝毫不顾及其他博弈方的利益。某种情况下,当参与重复博弈中的一方表现出合作倾向时,其他的参与者也会在接下来的决策行动中选择与其合作的态度,进而帮助双方达成长期获利的合作。

当参与博弈的人自身的所有信息都不被他人所了解时,那么他能够在整个重复博弈的过程中建立良好的声誉,借此他极有可能获得长远的利益。

囚徒困境

当对方的合作意图不明显或者不能确认时,出卖对方是能使自身利益最大化的,不过有可能会遭到不同形式的报复。

智猪博弈

若选择等待的收益大于行动的收益就要选择等待时机,不为才能有所为。

斗鸡博弈

双方都选择前进,结果便是两败俱伤。相较这些不同的选择来看,最好的结果便是双方都选择退让,既不会两败俱伤,又不会让其中的某一方丢了颜面。

猎鹿博弈

两个人合作获得的利益远远超过单独行动带来的利益,但是这便需要个人的能力和付出是相等的。假设两个人中某一个人的捕猎能力较强,那么他就会要求获得更多的利益,同时这会使另外一个猎人考虑到自身的利益而不选择与其合作。

若想在博弈中建立合作,便需要参与博弈的双方主动学会与对手建立良好的共赢关系,在保证自身利益的同时,也要考虑对方的利益。

蜈蚣博弈

参与者在进行决策时,会考虑到最后一次选择;同时他会考虑最后一次究竟是否选择合作还是不合作,假设合作带给他的收益是100,不合作带给他的收益是101,那么他就会选择不合作。

酒吧博弈

假设有100个人都喜欢去酒吧消遣娱乐,而酒吧的座位是有限的,这就说明这100个人在周末时会考虑究竟是否去酒吧。

上一次去酒吧的现象,会成为下一次选择的一个参考。

警察与小偷博弈

当对方了解自己的策略时,自己便会面临极大的输掉游戏的风险。

博弈的取胜要点在于运用其中的偶然性,针对对方是否发现你的某些策略性行为做出及时反映,进而保证自己的成功的概率。

海盗分金

海盗分金要通过投票就必须以最小的代价获得最大的收益;分最小的利益给他人,保证自己通过,不会被投入大海。

译者序

如果甲方先行,且行棋方式完全正确,那么乙方将永远无法击败他;同样,若乙方先行,且行棋方式完全正确,那么甲方也永远无法击败他。

参与这个零和博弈的人都试图使自己的利益最大化,于是他们都想尽可能地使对方的利益最小化,因为只有这样才能最大化自己的利益。

导读

如何找到一个最优策略

而理性就意味着他在博弈中是从自己的利益出发的,或者说他是自私的。理性的人在博弈过程中会将自身利益最大化作为自己的目标。

博弈中合作的过程和规律

群体中的合作是逐渐扩大化的,或者说,群体是向着越来越合作进化的。

“不善良”程序总是让自己得到高分,使对方得低分,它总是把自己的利益建立在别人的损失之上,即使它能在一段时间内继续生存,但当那些失败者被淘汰之后,这个投机取巧、爱占别人便宜的成功者也会被淘汰。

即使不合作在一个群体中占有较大比例,他们也不会在未来的进化中一直增长下去。这说明社会群体是向着合作方向进化的,且这个进化的大方向是不可逆转的,随着群体的发展,他们的合作性会越来越大。

合作性的提高第一是要建立在持久的关系,爱情很美好,但恋人之间的合作也需要建立在婚姻契约上才能长久。第二是每一个想提高合作性的人都要提高识别别人行动的能力,如果你连对方是否合作都搞不清楚,你便没法对他的行为做出回报。第三是要说到做到,信誉第一,若比赛的某一回合别人对你采取不合作策略,你承诺在下一轮比赛中也不与他合作,就一定要做到,当别人知道你是个不好惹的人,就不敢不与你合作。第四是避免一次性对局,能多次完成的对局要尽量分步完成。这样做的好处在于可以使对弈双方长久地维持关系,如此才有合作的可能,比如在贸易谈判的过程中尽量多步骤进行,这样可以一步步敦促别人与你合作。第五是对于别人的成功不要嫉妒,对于别人的失败不要落井下石,第六是不要主动背叛别人,避免成为罪魁祸首,成为众矢之的。第七是不仅要对合作予以回报,也要对背叛进行“回报”。第八是不要贪小便宜,耍小聪明占别人便宜的人不会有人与他合作。

无偿捐款看似是一种纯粹的利他行为,但这种行为也可能间接地得到回报,比如它能为捐款者赢得社会声誉等。

由于现实社会生活中充满了随机性,所以这些策略都不能成为最优策略,这正是“一报还一报”在多变环境中的缺陷所在。

人与人之间应该“以德报德,以直报怨”的观点,这是一种“修正的一报还一报”策略,其先进程度跨越了几千年。“直”的意思是公正,“以直报怨”就是用公正来回报背叛,其所修正的是惩罚背叛者的程度,依据公正的原则,本来要罚背叛者10分,现在只需罚其5分。这样做可以结束世代循环报复的魔咒,让文明得以形成。

参与者在遭到背叛后往往没有机会给予反击,甚至毫无还手之力,比如核威慑、资本实力悬殊的违约行为等。因此,这时就要引入法律手段,用法律的惩罚来取代“一报还一报”,实现依法治国,以法律促进合作。

博弈论的应用

企业的最低价条款可以使消费者在未来一周内不因商品降价而后悔购买商品,这不仅是对消费者的一种承诺,也是对竞争者的一种警告。

而当竞争对手被驱逐到市场外后,企业就能利用自身在市场内垄断地位回调价格,并以垄断高价弥补前期的损失。

限制定价针对的是还未进入商场的潜在竞争对手,其目的是以一段时间内维持低价来打消潜在对手进入市场,而掠夺性定价针对的是即将或已经踏入行业市场的新企业,例如你在新企业进入时扩张产能,使行业的产能过剩,并以超低价竞争,往往就能防止新企业进入。

一个企业的产品质量堪忧,那么它一般不会去做巨额广告,因为低质量经验品很少能吸引回头客,它明白自己没有强硬的筹码去博弈。


文章版权声明:除非注明,否则均为格言阁原创文章,转载或复制请以超链接形式并注明出处。
取消