大選熱戰方酣,各種不成議題的議題不斷躍居版面,在眾家媒體不斷炒作下,含涉的候選人或氣定神閑、或面紅耳赤,或高分貝大聲喊冤,又或四處告急,演戲的卯足戲癮,看戲的激情叫好,然於我觀之,此種捉對廝殺的場合,恰是驗證賽局理論的最佳時刻。
翻找過去所寫的文章,包括「台版驚爆十三天之誰是膽小鬼」和「旅人兩難、美元拍賣以及膽小鬼遊戲」,均係四年前大選時後的憂心觀察。如今政黨輪替兩回,雙方兩造依舊意欲置對方於死地、棄人民福祉於無顧,灰心之餘,僅能再度比對賽局理論和大選混戰,當作是帝力於我何哉的無奈笑談。
1. 三方賽局
「雙人零合賽局」是最簡單、也是最基本的賽局模型,可以上一屆大選作為典型範例,不過在這次大選中出現變數,增加了一組人馬,也因此大大增加了複雜程度。數學家馮紐曼(John von Neumann)和摩根斯坦(Oskar Morgenstern)於1944出版最重要的賽局著作「賽局理論與經濟行為」時,除了討論最簡的2人賽局,並未迴避3人或多人賽局的問題。不過在處理類似問題時,馮紐曼取了個簡化的巧,採用「聯盟」的方式來降低問題的複雜程度,所以考慮3人參賽的情況時,可以假設其中利益相似的2方將結成聯盟,則可化繁為簡的回復到雙人賽局。說穿了,這種聯盟方式就是「聯合次要敵人、打擊主要敵人」策略,歷史上反覆運用的案例多不可勝數,而對照到這次大選,當鳴槍起跑的伊始,我們看到居最弱勢的第3方面臨「連署」問題時,較強的2方中居弱勢的一方很明顯的伸出援手,也因而削弱的當時最強勢的一方!
至於3方態勢確立後的局面,對零合賽局來說則再無聯盟的可能,此時另一位賽局理論大將納許(John Nash)—電影《美麗境界》中那位擁有奇特人生的天才—提供了更複雜的解,也就是讓他獲頒諾貝爾獎的「納許均衡」,後來則衍伸出「非合作賽局理論」 和「交易理論」。只不過這種種策略一旦很理性的考量「我的計算必須考慮你的計算,而你的計算也考慮了我的計算」時,鹿死誰手似乎陷入某種膠稠困境。
2. 競相喊價的美元拍賣
「美元拍賣」並不算是正統賽局,因為它完全跳脫賽局計算中的理性和邏輯,反而更像是party中炒熱氣氛的遊戲,當大家都喝了點酒,受到眾人慫恿而失去部分理智和計算能力時,無視於標的物的真正價值而競相喊價,到頭來次低標者當然大輸,但得標者也沒贏,可說是一種可笑的「雙輸賽局」。
這種莫名其妙的賽局是否可能真實發生?當我向家人說明「美元拍賣」的其中奧妙時,他們都露出不可置信的眼神,懷疑怎麼可能有人會如此愚蠢、拿3~5美元去標下1美元?不過如果比照大選,我們是不是也看到雙方的喊價動作呢?譬如老人、老農津貼或其他年金,每逢大選必定上漲,動輒你出六千、我喊八千,輸人不輸陣的用力出口,福利、農業、經濟政策的整體考量只能暫且拋之於後。至於是誰得利?老人、老農不一定得利,因為社福餅就那麼一小塊,六千、八千也不夠餬口;沒當選的鐵定是輸了,但當選的那一方卻也焦頭爛額,必須努力解決當初被拋在腦後的整體財金考量,由於大餅難以增加,如何擠出這一筆錢以避免政策跳票,或甚至影響下一次大選選情,形成了雙方「美元拍賣」的困境。
3. 反覆「囚犯困境」賽局
說困境。賽局理論最著名的困境就是「囚犯困境」了,不過若討論雙人賽局的各種可能,參賽的雙方採用「合作,C」或「背叛,D」的策略來區分,將產生2×2=4種組合(CC、CD、DC、DD),再考慮這4種情況分別代表的利益(即CC、CD、DC、DD之間孰大孰小或甚至相等),則一共產生78種情形,「囚犯困境」僅是其中之一(DC>CC>DD>CD,見下圖)!
依據理性分析,在僅有一次機會的「囚犯困境」賽局中,最佳的策略便是背叛,因為無論如何都比採取合作而被對方背叛(CD)來得好,但如果不止一次機會呢?佛拉德/德萊歇(Flood & Dresher)於1950年進行了著名的實驗,相同對手反覆進行了100次賽局,統計結果顯示互採合作策略佔了最大比重(60/100),顯然2人在進行多次之後立即領悟,同採合作方式可以讓自己利益大增,不過同樣也想到,偶一為之的背叛也可嚐到甜頭。1980年密西根大學政治學教授艾瑟羅德(Axelrod)作了一系列的電腦「錦標賽」,以編寫好的電腦程式進行200次的競賽,程式採用的策略不一,永遠合作、永遠背叛或隨機選擇等等,以最後的得分來決定高下。這樣的競賽共舉辦3次,在第3次中,艾瑟羅德更想知道,如果電腦程式具有人為天擇能力時,結果將如何?
他的作法是這樣,在每一回合的競賽後,他讓電腦程式得以複製,複製的數量取決於得分高低,也就是讓成功的策略可以繁殖更多的下一代。有趣的結論是,在歷次競賽或「天擇」的情況,最高得分永遠是「一報還一報」的極簡策略,以合作開局、絕不首先背叛,而後根據對手前一次的出手方式來決定自己的出手。簡單的說,它符合我們基本的倫理信條:「你希望別人怎麼待你,就應該怎樣對待別人」。
很顯然,反覆賽局與單一賽局的結論之所以不同,在於雙方認知為了保證未來的合作,則目前採取合作將是最合理的行為。不過這樣的結論若牽涉到複雜的人性,在「有回合限制」的最後一次賽局將出現微妙的變化,因為雙方了解這是最後一回賽局,所以即使先前已採合作方式,也免不了想冒險背叛一次,只因為我背叛、他合作(DC)的收益最大。但如此一來,最後一回的賽局便如同單一賽局,將以相互背叛(DD)收場,而且,假設共100次競賽,則當第100次等同於單一賽局時,第99回合又成為最後一回賽局,第98、97、96的往前推,又落入最初相互背叛的「囚犯困境」裡了。
回到大選。大選是標準的雙人零合賽局(我暫且忽略第三方),而且只進行一次,所以不必冀望看到任何合作的可能,也因此雙方坐困在囚籠裡,表現出來的行為就是相互砍伐、攻訐和比爛。但情勢是不是有可能改變?大選每4年舉辦一次,多次輪替下來,按理性分析應可營造出「反覆囚犯困境賽局」的合作契機,但是………?是的,我們的政治人物都同時缺乏記憶和前瞻,都只會停留在「一報還一報」的相互背叛裡,總以為這是最大利益所在,其智慧連最簡單的電腦程式都不如!(「一報還一報」電腦程式只有短短4行)
4. 理性與非理性
「你怎麼能這樣?一個數學家,一個深信理性及邏輯證明的人,怎麼會相信有外太空的人在傳送訊息給你?怎麼會相信自己被外太空人網羅來拯救這個世界?」
「因為,」納許慢慢的用他溫柔、理性、懶洋洋的南方口吻、自言自語般地說:「這些超自然觀念的產生方式,就如我得到數學上的想法一樣,因此,我必須嚴肅的看待他」
沒有惡意,只是對照著有點滑稽梯突的演出,忍不住節錄「美麗境界」書中的這段對話,我們的大選充滿太多可供探究的細微處啊!
附註:其實選舉與賽局最大的不同,在於參賽者並不能真正決定自己的命運,而是由更大數量的參與者來共同決定。類似的集體行動是更符合人類行為的,譬如經濟行為,也譬如政治行為,不過因為過於複雜,已非賽局理論所能解決,有興趣者可搜尋"Many- person-dilemma" 或 "Voter's Paradox" 的解釋。
文章定位: