博弈论题
发布网友
发布时间:2022-04-20 17:38
我来回答
共2个回答
热心网友
时间:2023-09-01 04:11
第一次接触博弈是在给我的学生上供应链管理,学生们感觉课本很无聊,其中有在供应链的合作伙伴选择中提到了 博弈 一词,上网查了一下,发现博弈很有意思,她涉及到我们生活的方方面面,只是大家没察觉,2个或者以上的人只要有互动就有博弈存在,单独一个人也存在博弈:例如如果我感冒了,我就会与上帝博弈:我是选择吃药,还是简单的多喝点水,还是置之不理,上帝就会根据我的选择“制定”我感冒的结果。
现在我给新的班级上课前第一节课都会见解一下博弈(给计算机专业的上课,我就强调信息流的重要,其他专业也可以联系起来,因为处处有博弈),囚徒困境也暗含着人与人之间要多沟通,这样结果就会最优(沟通的少也不可以,如果让囚徒提前接触10分钟,结果可能还是同样的)下边几个例子是我讲给学生的,通俗易懂。
有点长,建议你看完后再看一下电影《美丽心灵》
学习供应链管理之前,建议先学习一下博弈论,通过学习博弈论,我们就可以看到企业实施供应链管理的重要性和必要性
博弈之我见
这节课我们先来做一个智力测验:海盗分珠宝。
有五个海盗抢得100颗价值连城的珠宝,这100颗珠宝完全相同。那么现在就要分脏了(海盗不会按我们常规的分法,每个人都想分得最多),于是有人提出一个方法,大家都同意了,这个方法是:抽签将五个海盗排成1,2,3,4,5号,由1号海盗开始,让他来提出一个分配方案,决定每个人该分多少,然后所有海盗(包括他自己)一起进行举手投票,如果有50%以上(包括50%)的海盗同意,那么就按他的分配方案来,但如果没有达到这个标准,那他将被扔进海里喂鲨鱼,而后由2号来提方案,以此类推,直到只剩5号海盗为止。
条件:
1.每个海盗只想获得最大利益。
2.所有海盗都是非常理智的
这就是一个博弈问题,大家可以想想,如果你是海盗,你希望是第几个海盗?如果你是第一个海盗,你怎么分这100颗珠宝?
下边的问题有点枯燥,我来讲一下博弈的概念,如果没兴趣的,可以动笔分析解答海盗问题。
一、博弈的概念
博弈简单的看,弈,就是下棋的意思,博弈,就是很多人下棋的意思。像象棋、五子棋、扑克等等都是最直接的博弈。
博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化的过程。
博弈存在于我们生活的方方面面,从我们早上起床穿哪件衣服,吃什么早饭,老师讲课,我是听还是聊天....这些都是博弈
再像2000多年前,《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著,2000年后,*提出的“人不犯我,我不犯人;人若犯我,我必犯人”也是一种博弈。
现在给大家5分钟时间思考一下海盗问题......答案是 98 0 1 0 1
现在我们再来看一个例子:让10000个人从1-100里选择一个数,最后选择离大家的平均值的一半最接近的就获胜。
通常认为,人数够多,选择的数字就分散,所以最后的平均数应该接近50,所以我选25=50/2应该获胜把握大。
但我再想,我知道这个其他人也知道这个,所以假定他们也都选25,那我就该选12.5=25/2。
同样道理,别人也会想到这点,如此不断,最后大家都选1。没有获胜者。
二、博弈的种类
1、博弈可以分为动态博弈和静态博弈。
静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。像前边讲的平均值问题。
动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。像前边讲的海盗问题。
三、我们为什么学习博弈
我们说过任何一个人做的任何一件事多多少少都有博弈的因素在里边。
诺贝尔经济学奖获得者包罗·萨缪尔逊如是说:
要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。
也可以这样说,要想赢得物流管理,不可不学博弈论;要想赢得生活,同样不可不学博弈论,甚至你的感情也与博弈有关。
理论的不讲了,我们现在就通过几个例子来学习博弈:
1、经济学中的“智猪博弈”(Pigs’payoffs)
这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。
如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。
改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“*主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。
原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,*如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。
比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。
2、囚徒困境博弈
在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个*与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被*抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的*是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
分析:略,A通过分析可得,无论B如何选择,自己选择坦白都是明智的,同理可得A也是选择坦白,而我们知道最优方案应该是都抵赖。
这就是个人利益最大并不能实现整体的利益最大化,这个问题最先被纳什发现,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。
《美丽心灵》就是讲纳什的
如果他们4个全部去追那漂亮女生,那她一定会摆足架子,谁也不搭理;这时再去追其他女孩子,别人也不会接受,因为没人愿意当次品。”突然,纳什自言自语道,“但是,如果他们4个先追其他女生,那漂亮女生就会感到被孤立,这时再追她就简单得多。
《老友记》
瑞秋和罗斯爱情坦白博弈
当然电视剧追求完美结果,现实中如何处理爱情博弈。
从“囚徒困境”这个典型博弈问题,我们可以深刻体会到企业实施“供应链管理”的必要性。(略)
热心网友
时间:2023-09-01 04:11
建议搜索有关《身边的博弈》——董志强著的读者读后写的文章,浅显易懂。电子本的就别想了,我也在找。。。
答案: 经济学中的“智猪博弈”(Pigs’payoffs)
看到一道好题目,发上来给大家做做
100枚金币,有五个海盗分,其中有一个海盗提出一个方案,必须大于等于50%的人通过。没达到就必须被推下船喂鲨鱼。然后第二个人来分,以此类推。。。
请问第一个海盗最大的获益是什么?
再引申一下:如果必须要大于50%的人通过又怎么样呢?
我们的问题是:如果你是第一个人,你会提出怎样的分配方案?
为了分析问题更确定,博弈的前提是假定每个人都是追求自己利益极大化的人。可能你会提出平均分配,每人20两,或者自己不要,等等。 答案却并非如此。
第一个人会说:"100两金子全归我!而且这个方案一定会被一半以上的人同意,这个人不会被杀掉。
这个问题比较复杂,当遇到复杂的问题时,我们可以从最后的环节开始考虑,这样,可以使问题清晰起来。那我们就从抓到最后一个阄的人开始考虑。
对于这个人来说,他知道,当轮到他提方案的时候,其他人都已经死掉了,金子将全是他一个人的。所以,他利益最大化行为便是,不管前边谁,包括第一个人,提了任何方案,他都一概摇头,不同意。
再看第四个人,他知道,不管自己提出什么方案,第五个人都不会同意,都会被杀掉,所以,他的利益最大化行为是,尽量不要轮到自己提方案。所以,不管第一个人提了怎样的方案,他都会表示同意。
第三个人,知道第四和第五个人的选择策略,所以,他的利益最大化的方案是100两金子全归自己。这个方案,因为自己和第四个人同意,超过了此时的一半以上的人的同意,可以行得通,所以,不管第一个人提出什么样的方案,第三个人都会反对。
第二个人,知道自己提什么方案,第三个人、第五个人都将反对,一旦轮到自己提,自己就死定了,所以,他会同意第一个人提出的任何方案,这是他的利益最大化行为。 所以,不管第一个人提出怎样的方案,第二个人与第四个人都会同意,加上第一个人自己的票,就是三票,一半以上,可以通过。
既然任何方案都可以通过,而第一个人又要追求自己利益的极大化,所以,他的方案是:100两金子全归自己。 这个例子告诉我们,想问题,确实需要方*,靠直觉是不可以的,直觉在很多情况下是错误的,必须依靠方法,依靠逻辑的力量,这就是博弈。
这是经济上的著名模型海盗分金。要补充个条件是每个海盗都足够聪明都想自己的利益最大化!用倒退*证。此类问题体现出的多方博弈情况下的生存哲学: 1、没有永恒的朋友,只有永恒的利益。
2、在临界点之下,以决策者的身份出场,冒最大的风险,得到最大的利益。
3、在接近临界点的地方,是收益分配最接近公平的地方。半数的人均匀地受益,另半数的人均匀地不受益。
4、越过临界点之后,以决策者的身份出场,风险极大,甚至会将老本赔进去,而收益却为零,这是最糟的情况,因为大家的收益都不高。这是一种不稳定的状态,系统会通过自我调整向临界点靠拢。
5、永远都不可能发生所有人都有收益的情况,任何时候都有至少 一半或者接近一半 人无收益,除非只有1个人。