博弈是什麼意思博弈的分類
博弈本意是:下棋。引申義是:在一定條件下,遵守一定的規則,一個或幾個擁有絕對理性思維的人或團隊,從各自允許選擇的行為或策略進行選擇並加以實施,並從中各自取得相應結果或收益的過程。那麼你對博弈瞭解多少呢?以下是由小編整理關於博弈是什麼意思的內容,希望大家喜歡!
博弈的簡介
一個完整的博弈應當包括五個方面的內容:第一,博弈的參加者,即博弈過程中獨立決策、獨立承擔後果的個人和組織;第二,博弈資訊,即博弈者所掌握的對選擇策略有幫助的情報資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先後;第五,博弈方的收益,即各博弈方做出決策選擇後的所得和所失。
博弈的分類
從博弈的研究正規化來劃分,可分為傳統博弈論和演化博弈論;從博弈的具體應用來劃分,可分為靜態博弈和動態博弈。靜態博弈是指在博弈中,兩個參與人同時選擇或兩人不同時選擇,但後行動者並不知道先行動者採取什麼樣的具體行動。對雙方來說,都容易形成混沌的行為重組,由於規則的嚴密與精細,任何人因時間問題、資金問題、心理問題等等,致使在多次均衡後直到不明不白地造成大輸,參與靜態博弈和動態博弈的大部分都是這種人。動態博弈是指在博弈中,兩個參與人有行動的先後順序,且後行動者能夠觀察到先行動者所選擇的行動。
根據參與者能否形成約束性的協議,以便集體行動,博弈可分為合作性博弈和非合作性博弈。納什等博弈論專家研究得更多的是非合作性博弈。
所謂合作性博弈是指參與者從自己的利益出發與其他參與者談判達成協議或形成聯盟,其結果對聯盟方均有利;而非合作性博弈是指參與者在行動選擇時無法達成約束性的協議。人們分工與交換的經濟活動以及囚徒困境就是合作性的博弈,而公共資源悲劇都是非合作性的博弈。
從知識的擁有程度來看,博弈分為完全資訊博弈和不完全資訊博弈。資訊是博弈論中重要的內容。完全資訊博弈指參與者對所有參與者的策略空間及策略組合下的支付有“完全的瞭解”,否則是不完全資訊博弈。嚴格地講,完全資訊博弈是指參與者的策略空間及策略組合下的支付,是博弈中所有參與者的“公共知識”的博弈。對於不完全資訊博弈,參與者所做的是努力使自己的期望支付或期望效用最大化。
以此博弈哲學語言也可體現出以下四種博弈分類:
完全資訊靜態博弈、完全資訊動態博弈、不完全資訊靜態博弈、不完全資訊動態博弈
其中策略性博弈應屬於完全資訊靜態博弈,而完全資訊動態博弈則包括擴充套件性博弈和重複博弈等;不完全資訊靜態博弈則是以貝葉斯均衡等理論完成對混合策略的重新解釋,不完全資訊動態博弈則是完美貝葉斯均衡為核心概念的訊號博弈。
博弈論的介紹
博弈論又被稱為對策論Game Theory既是現代數學的一個新分支,也是運籌學的一個重要學科。
博弈論主要研究公式化了的激勵結構間的相互作用。是研究具有鬥爭或競爭性質現象的數學理論和方法。 博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的優化策略。生物學家使用博弈理論來理解和預測進化論的某些結果。博弈論已經成為經濟學的標準分析工具之一。在生物學、經濟學、國際關係、電腦科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。基本概念中包括局中人、行動、資訊、策略、收益、均衡和結果等。其中局中人、策略和收益是最基本要素。局中人、行動和結果被統稱為博弈規則。
博弈論畢竟是數學,更確切地說是運籌學的一個分支,談經論道自然少不了數學語言,外行人看來只是一大堆數學公式。好在博弈論關心的是日常經濟生活問題,所以不能不食人間煙火。其實這一理論是從棋弈、撲克和戰爭等帶有競賽、對抗和決策性質的問題中借用的術語,聽上去有點玄奧,實際上卻具有重要現實意義。博弈論大師看經濟社會問題猶如棋局,常常寓深刻道理於遊戲之中。所以,多從我們的日常生活中的凡人小事入手,以我們身邊的故事做例子,娓娓道來,並不乏味。話說有一天,一位富翁在家中被殺,財物被盜。警方在此案的偵破過程中,抓到兩個犯罪嫌疑人,斯卡爾菲絲和那庫爾斯,並從他們的住處搜出被害人家中丟失的財物。但是,他們矢口否認曾殺過人,辯稱是先發現富翁被殺,然後只是順手牽羊偷了點兒東西。於是警方將兩人隔離,分別關在不同的房間進行審訊。由地方檢察官分別和每個人單獨談話。檢察官說,“由於你們的偷盜罪已有確鑿的證據,所以可以判你們一年刑期。但是,我可以和你做個交易。如果你單獨坦白殺人的罪行,我只判你三個月的監禁,但你的同夥要被判十年刑。如果你拒不坦白,而被同夥檢舉,那麼你就將被判十年刑,他只判三個月的監禁。但是,如果你們兩人都坦白交代,那麼,你們都要被判5年刑。”斯卡爾菲絲和那庫爾斯該怎麼辦呢?他們面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結果是大家都只被判一年。但是由於兩人處於隔離的情況下無法串供。所以,按照亞當·斯密的理論,每一個人都是從利己的目的出發,他們選擇坦白交代是最佳策略。因為坦白交代可以期望得到很短的監禁———3個月,但前提是同夥抵賴,顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對方坦白了而自己抵賴了,那自己就得坐10年牢。太不划算了!因此,在這種情況下還是應該選擇坦白交代,即使兩人同時坦白,至多也只判5年,總比被判10年好吧。所以,兩人合理的選擇是坦白,原本對雙方都有利的策略抵賴和結局被判1年刑就不會出現。這樣兩人都選擇坦白的策略以及因此被判5年的結局被稱為“納什均衡”,也叫非合作均衡。因為,每一方在選擇策略時都沒有“共謀”串供,他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。也就是說,這種策略組合由所有局中人也稱當事人、參與者的最佳策略組合構成。沒有人會主動改變自己的策略以便使自己獲得更大利益。“囚徒的兩難選擇”有著廣泛而深刻的意義。個人理性與集體理性的衝突,各人追求利己行為而導致的最終結局是一個“納什均衡”,也是對所有人都不利的結局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當他們都首先替對方著想時,或者相互合謀串供時,才可以得到最短時間的監禁的結果。“納什均衡”首先對亞當·斯密的“看不見的手”的原理提出挑戰。按照斯密的理論,在市場經濟中,每一個人都從利己的目的出發,而最終全社會達到利他的效果。不妨讓我們重溫一下這位經濟學聖人在《國富論》中的名言:“通過追求個人的自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益。”從“納什均衡”我們引出了“看不見的手”的原理的一個悖論:從利己目的出發,結果損人不利己,既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說,“納什均衡”提出的悖論實際上動搖了西方經濟學的基石。因此,從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利己策略”。但它必須符合以下黃金律:按照你願意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿施於人”。但前提是人所不欲勿施於我。其次,“納什均衡”是一種非合作博弈均衡,在現實中非合作的情況要比合作情況普遍。所以“納什均衡”是對馮·諾依曼和摩根斯特恩的合作博弈理論的重大發展,甚至可以說是一場革命。
從“納什均衡”的普遍意義中我們可以深刻領悟司空見慣的經濟、社會、政治、國防、管理和日常生活中的博弈現象。我們將例舉出許多類似於“囚徒的兩難處境”這樣的例子。如價格戰、軍備競賽、汙染等等。一般的博弈問題由三個要素所構成:即局中人players又稱當事人、參與者、策略等等的集合,策略strategies集合以及每一對局中人所做的選擇和贏得payoffs集合。其中所謂贏得是指如果一個特定的策略關係被選擇,每一局中人所得到的效用。所有的博弈問題都會遇到這三個要素。
博弈的分類
出櫃是什麼意思出櫃的由來