《序貫決策博弈相關(guān)知識(shí)》由會(huì)員分享,可在線閱讀,更多相關(guān)《序貫決策博弈相關(guān)知識(shí)(41頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,*,單擊此處編輯母版標(biāo)題樣式,*,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),第四章 序貫決策博弈,序貫決策博弈:局中人做出策略選擇時(shí)知道對(duì)手的策略選擇。,實(shí)驗(yàn):槍手博弈1,三個(gè)快槍手相互之間的仇恨到了不可調(diào)和的地步。這天他們?nèi)诮稚喜黄诙?,每個(gè)人的手都握住了槍把,一場(chǎng)生死決斗馬上就要開始,已知這三個(gè)人中甲槍法精準(zhǔn),十發(fā)八中;乙的槍法也不錯(cuò),
2、十發(fā)六中,丙的槍法拙劣,十發(fā)四中。假如三個(gè)人同時(shí)開槍,決一死戰(zhàn),一槍后誰(shuí)最后活下來(lái)的機(jī)會(huì)大一些?,實(shí) 驗(yàn):槍手博弈2,假設(shè)現(xiàn)在三個(gè)槍手決定輪流開槍,誰(shuí)活下來(lái)的機(jī)會(huì)大一些?,實(shí) 驗(yàn):海 盜 分 寶,五個(gè)海盜搶到100顆寶石,他們決定按如下方法來(lái)分配:先抽簽決定順序(1,2,3,4,5);然后先由1號(hào)提出分配方案,其余的人進(jìn)行表決,當(dāng)且僅當(dāng)半數(shù)和超過(guò)半數(shù)的人同意時(shí),則按1號(hào)所提方案分配,否則將1號(hào)扔進(jìn)大海喂鯊魚,當(dāng)1號(hào)方案被否決,則由2號(hào)提出分配方案,其余的人進(jìn)行表決,以此類推,假定這些海盜都是理性人,問(wèn)第一個(gè)海盜應(yīng)提出怎樣的分配方案才能獲得通過(guò)并使自己的收益最大?,本章討論動(dòng)態(tài)博弈,所有博弈方都
3、對(duì)博弈過(guò)程和得益完全了解的完全且完美信息動(dòng)態(tài)博弈。這類博弈也是現(xiàn)實(shí)中常見的基本博弈類型。由于動(dòng)態(tài)博弈中博弈方的選擇、行為有先后次序,因此在表示方法、利益關(guān)系、分析方法和均衡概念等方面,都與靜態(tài)博弈有很大區(qū)別。本章對(duì)動(dòng)態(tài)博弈分析的概念和方法,特別是,子博弈完美均衡和逆推歸納法作系統(tǒng)介紹,并介紹各種經(jīng)典的動(dòng)態(tài)博弈模型。,主要內(nèi)容,1、,序貫博弈的定義和表示方法,2、尋找序貫博弈納什均衡的“箭頭排除確定法”(舊版教材上稱為虛線排除確定法),3、尋找序貫博弈納什均衡的“倒推法”,4、先動(dòng)優(yōu)勢(shì)和后動(dòng)優(yōu)勢(shì),5、“倒推法”的缺陷,一、序貫博弈的定義和表示方法,假如某個(gè)壟斷企業(yè)一年可以賺10億元的利潤(rùn),假定別
4、的企業(yè)為了進(jìn)入該行業(yè)需要投資4億元。當(dāng)新的企業(yè)準(zhǔn)備進(jìn)入時(shí),原有壟斷企業(yè)有兩種決策,(1),“容忍”,但利潤(rùn)要變?yōu)?億元。這時(shí)新的企業(yè)可以得5億,減去4億投資,仍有1億。,(2)“抵抗”,例如降低價(jià)格,企業(yè)的利潤(rùn)變?yōu)?億元,且新的企業(yè)也只得2億,但減去投資,虧損2億。,誰(shuí)先動(dòng)?潛在進(jìn)入者,簡(jiǎn)稱“進(jìn)入者”,如何表示該博弈?,分析“進(jìn)入者”和“壟斷者”的純策略。,博 弈 樹,用博弈樹來(lái)表示序貫博弈。,它描述了博弈參與人的一個(gè)序貫決策過(guò)程,從博弈數(shù)的根開始,到末端點(diǎn)結(jié)束。,擁有初始決策節(jié)點(diǎn)的局中人先做出決策,他的決策引出博弈樹的棱,而棱的末端將是下一個(gè)局中人做出決策,依此類推。,進(jìn)入障礙博弈,進(jìn)入者,
5、進(jìn)入,不進(jìn),壟斷者,容忍,抵抗,容忍,抵抗,(1,5),(-2,2),(0,10),(0,4),壟斷者,a,b,c,“進(jìn)入者”和“壟斷者”的純策略,“進(jìn)入者”的有兩個(gè)純策略:進(jìn)入和不進(jìn)入,“壟斷者”的有四個(gè)純策略:,不管你怎樣,我總是容忍容忍,容忍,不管你怎樣,我總是對(duì)抗對(duì)抗,對(duì)抗,你進(jìn)我對(duì)抗,你不進(jìn)我忍對(duì)抗,容忍,你進(jìn)我忍,你不進(jìn)我對(duì)抗容忍,對(duì)抗,注:花括號(hào)第一項(xiàng)表示壟斷者在上決策節(jié)點(diǎn)b,即進(jìn)入者選擇進(jìn)入時(shí)他要選擇的行動(dòng),第二項(xiàng)表示壟斷者在下決策節(jié)點(diǎn)c,即進(jìn)入者選擇不進(jìn)入時(shí)他要選擇的行動(dòng)。,假設(shè)壟,斷,斷企業(yè),的,的老板,交,交給你,這,這樣的,策,策略:對(duì)抗,,,,容忍,你,明,明白應(yīng),該
6、,該如何,行,行動(dòng)嗎,?,?,策略就,是,是一個(gè),完,完整的,行,行動(dòng)計(jì),劃,劃,使,得,得你可,以,以把它,交,交給另,外,外一個(gè),人,人,讓,他,他知道,如,如何代,表,表你去,執(zhí),執(zhí)行這,個(gè),個(gè)策略,。,。,什么是,計(jì),計(jì)劃:,“,“如果,對(duì),對(duì)手選A,我,將,將采取,行,行動(dòng)X,,,,如果,,我,將,將采取,行,行動(dòng),。,?!?行動(dòng)與,策,策略,在同時(shí),決,決策博,弈,弈中,,行,行動(dòng)就,是,是策略,。,。,但在序,貫,貫決策,博,博弈中,,,,行動(dòng),是,是指每,一,一個(gè)決,策,策點(diǎn)上,局,局中人,的,的決策,變,變量或,行,行動(dòng)的,具,具體抉,擇,擇。策,略,略就是,一,一個(gè)完,整,
7、整的行,動(dòng),動(dòng)計(jì)劃,。,。,策略組,合,合,該博弈,有,有八種,可,可能的,策,策略組,合,合:,(,進(jìn),進(jìn)入,,,,(,上,上)容,忍,忍,(,下,下)容,忍,忍,),),(,進(jìn),進(jìn)入,,,,(,上,上)對(duì),抗,抗,(,下,下)對(duì),抗,抗,),),(進(jìn)入,(上,),)對(duì)抗,(,下,下)容忍,),),(進(jìn)入,(上,),)容忍,(,下,下)對(duì)抗,),),(不進(jìn),(上,),)容忍,(,下,下)容忍,),),(不進(jìn),(上,),)對(duì)抗,(,下,下)對(duì)抗,),),(不進(jìn),(上,),)對(duì)抗,(,下,下)容忍,),),(不進(jìn),(上,),)容忍,(,下,下)對(duì)抗,),),支 付,進(jìn)入者純策,略,略與壟斷者,的
8、,的“計(jì)劃型,”,”策略形成,策,策略組合,,構(gòu),構(gòu)成一條路,徑,徑。,支付對(duì)應(yīng)每條路,徑,徑,而不是對(duì),應(yīng),應(yīng)每步選擇、,行,行為。,支付向量中,,,,數(shù)字的排,列,列按局中人,的,的出場(chǎng)順序,出,出現(xiàn)。(進(jìn),入,入者,壟斷,者,者),八種策略組,合,合對(duì)應(yīng)的支,付,付,(進(jìn)入,(上,),)容忍,(,下,下)容忍,),)(1,5),(進(jìn)入,(上,),)對(duì)抗,(,下,下)對(duì)抗,),)(-2,2),(進(jìn)入,(上,),)對(duì)抗,(,下,下)容忍,),)(-2,2),(進(jìn)入,(上,),)容忍,(,下,下)對(duì)抗,),)(1,5),(不進(jìn),(上,),)容忍,(,下,下)容忍,),)(0,10),(不進(jìn),(
9、上,),)對(duì)抗,(,下,下)對(duì)抗,),)(0,4),(不進(jìn),(上,),)對(duì)抗,(,下,下)容忍,),)(0,10),(不進(jìn),(上,),)容忍,(,下,下)對(duì)抗,),)(0,4),二、尋找序,貫,貫博弈的納,什,什均衡,例如:如圖,所,所示的情侶,博,博弈,分析,該,該博弈的納,什,什均衡?,男,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,(2,1),(0,0),(-1,-1),(1,2),男方和女方,的,的純策略,男方有兩個(gè),純,純策略:足,球,球和芭蕾,女方有四個(gè),純,純策略:,不管你怎樣,,,,我總是芭,蕾,蕾芭,蕾,蕾,芭蕾,不管你怎樣,,,,我總是足,球,球足,球,球,足球,你選擇什么,,
10、,,我就選擇,什,什么,足,足球,芭蕾,你選擇什么,,,,我就不選,擇,擇什么芭蕾,足,球,球,八種策略組,合,合,納什均,衡,衡在哪,該博弈有八,種,種可能的策,略,略組合:,(足球,(上,),)足球,(,下,下)足球,),),(足球,(上,),)足球,(,下,下)芭蕾,),),(足球,(上,),)芭蕾,(,下,下)足球,),),(足球,(上,),)芭蕾,(,下,下)芭蕾,),),(芭蕾,(上,),)足球,(,下,下)足球,),),(芭蕾,(上,),)足球,(,下,下)芭蕾,),),(芭蕾,(上,),)芭蕾,(,下,下)足球,),),(芭蕾,(上,),)芭蕾,(,下,下)芭蕾,),),用箭頭
11、排除,確,確定法尋找,納,納什均衡,將以上策略,在,在博弈書中,用,用粗線表示,。,。,將存在單獨(dú),改,改變激勵(lì)的,策,策略用箭頭,標(biāo),標(biāo)示。方法,如,如下:,(1)找到,第,第二階段兩,根,根粗線所對(duì),應(yīng),應(yīng)的支付。,(2)比較,這,這兩個(gè)支付,前,前面的數(shù)字,,,,如果大的,數(shù),數(shù)字所對(duì)應(yīng),的,的那條“樹,枝,枝”是細(xì)的,,,,則男方存,在,在單獨(dú)偏離,的,的動(dòng)機(jī),則,男,男方的策略,選,選擇用箭頭,標(biāo),標(biāo)示。,(3)比較,這,這兩個(gè)支付,后,后面的數(shù)字,,,,其中對(duì)應(yīng),第,第一階段“,樹,樹枝”是細(xì),的,的那個(gè)數(shù)字,可,可以不再考,慮,慮,因?yàn)槟?方,方?jīng)]選這個(gè),方,方向。它是,“,“虛
12、”的。,(4)因此,只,只在男方選,的,的那個(gè)“樹,丫,丫”上進(jìn)行,比,比較女方的,支,支付,如果,大,大的數(shù)字對(duì),應(yīng),應(yīng)的“樹枝,”,”是細(xì)的,,則,則女方的策,略,略選擇“樹,枝,枝”用箭頭,標(biāo),標(biāo)示。(P142),虛線排除確,定,定法的缺陷,該方法可以,找,找到納什均,衡,衡,但找不,到,到博弈的最,終,終結(jié)果。,均衡是策略,的,的組合,而,結(jié),結(jié)果則是行,動(dòng),動(dòng)的組合。(P143),因此,我們,一,一般用倒推,法,法(Backwards Induction)來(lái)尋找,序,序貫博弈的,結(jié),結(jié)果。,三、尋找序,貫,貫博弈的結(jié),果,果倒推,法,法,從動(dòng)態(tài)博弈,的,的最后一個(gè),階,階段博弈方,的
13、,的行為開始,分,分析,逐步,倒,倒推回前一,個(gè),個(gè)階段相應(yīng),博,博弈方的行,為,為選擇,一,直,直到第一個(gè),階,階段的分析,方,方法,稱為,“,“倒推法”,或,或者“逆,推,推歸納法”,。,。,倒推法是動(dòng)態(tài)博弈分,析,析最重要、,基,基本的方法,。,。,步驟:,從博弈的最,后,后一個(gè)階段,開,開始分析,,通,通過(guò)比較最,后,后一個(gè)參與,決,決策的局中,人,人的支付,,推,推斷他或她,的,的選擇,從,而,而將他不會(huì),選,選的策略,“枝椏”,砍,砍掉,從而,回,回到上一個(gè),階,階段,比較,該,該階段參與,決,決策的局中,人,人的支付,,將,將他或她不,會(huì),會(huì)選的策略,砍,砍掉,依此,類,類推,男
14、,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,(2,1),(0,0),(-1,-1),(1,2),倒推法,:(1)在,上,上面一個(gè)枝,椏,椏上,,由于最后一,階,階段是女方,做,做決策,因,此,此比較女方,的,的支付1和0,將0所,對(duì),對(duì)應(yīng)的芭蕾,策,策略砍掉,,沒,沒砍掉的打,上,上箭頭。(2)在下面,一,一個(gè)枝椏上,,,,由于最后,一,一階段是女,方,方做決策,,因,因此比較女,方,方的支付-1和2,將-1所對(duì)應(yīng),的,的足球策略,砍,砍掉,沒砍,掉,掉的打上箭,頭,頭。(3),回,回到第一個(gè),階,階段,比較,帶,帶箭頭的兩,個(gè),個(gè)策略男方,的,的支付(因,為,為此時(shí)男方,做,做決策),,將,將
15、支付將較,小,小的策略砍,掉,掉。,女,博 弈 樹,例如:仿冒,和,和反仿冒博,弈,弈,A,B,B,A,不制止,制止,(-2,5),(2,2),(10,4),(5,5),不仿冒,(0,10),仿冒,不制止,制止,仿冒,不仿冒,練習(xí):法律,保,保障不足的,開,開金礦博弈,乙,甲,乙,打,(2,2),不分,分,不借,借,(,0,,,4,),(-1,0),不打,(1,0),逆,逆推歸納,法,法,乙,借,甲,不分,分,(0,4),(2,2),不借,(1,0),逆,逆推歸納,法,法,乙,借,不借,(1,0),(0,4),練習(xí)2:有法律保障,的,的開金礦博弈,不借,乙,甲,乙,借,不分,分,(1,0),不
16、打,打,(0,4),(1,0),(2,2),練習(xí)2:有法律保障,的,的開金礦博弈,不借,乙,甲,乙,借,不分,分,(1,0),不打,打,(0,4),(1,0),(2,2),倒推法的評(píng),價(jià),價(jià),倒推法只能,分,分析明確設(shè),定,定的博弈問(wèn),題,題,要求博,弈,弈的結(jié)構(gòu),,包,包括次序、,規(guī),規(guī)則和得益,情,情況等都非,常,常清楚,并,且,且各個(gè)博弈,方,方了解博弈,結(jié),結(jié)構(gòu),相互,知,知道對(duì)方了,解,解博弈結(jié)構(gòu),。,。這些可能,有,有脫實(shí)際的,可,可能。,逆推歸納法,也,也不能分析,比,比較復(fù)雜的,動(dòng),動(dòng)態(tài)博弈。,在遇到兩條,路,路徑利益相,同,同的情況時(shí),倒,倒推法也會(huì),發(fā),發(fā)生選擇困,難,難。,對(duì)博弈方的,理,理性要求太,高,高,不僅要,求,求所有博弈,方,方都有高度,的,的理性,不,允,允許犯任何,錯(cuò),錯(cuò)誤,而且,要,要求所有博,弈,弈方相互了,解,解和信任對(duì),方,方的理性,,對(duì),對(duì)理性有相,同,同的理解,,或,或進(jìn)一步有,理,理性的“共,同,同知識(shí)”。,四、先動(dòng)優(yōu),勢(shì),勢(shì)與后動(dòng)優(yōu),勢(shì),勢(shì),在序貫情侶,博,博弈中,任,何,何一方率先,采,采取行動(dòng)可,能,能得到的好,處,處,都比他,或