博弈論與霍布斯問題　　——兼答陳曉平教授的批評

簡體傳統

　　〔中圖分類號〕B08 〔文獻標識碼〕A　〔文章編號〕1000—0763（2000）05—0085—05
　　倫理學有幾個經久不衰的問題，這就是：（1 ）休謨價值問題：事實與價值的關系如何？我們能夠從事實判斷推出價值判斷嗎？（2 ）霍布斯問題：經濟人與倫理人的關系如何？我們能夠從經濟人的論述中推出倫理人的論述即倫理規范的論述嗎？（3 ）羅爾斯問題：功利與正義的關系如何？我們能夠從功利原則推出正義原則嗎？因而有比功利主義更高的原則嗎？（4）愛因斯坦問題：在倫理學中能建立公理體系嗎？如果能夠，倫理學的公理體系和理論結構有什么特點呢？（5 ）維持根斯坦問題：各種人類倫理行為，有共同的本質嗎？它們組成什么樣的家族類似類或它們是什么樣的類似的家族呢？所有這五個問題是相互關聯的，它們分別由休謨、霍布斯、羅爾斯、愛因斯坦和維持根斯坦這些著名的西方哲學家和科學家以尖銳明確的方式提出來的，不過中國古代的哲學家們也都曾以不同方式和不同程度上接觸到這些問題；尤其是在中國改革開放的偉大實踐中，在經濟體制改革和政治體制改革的探索中，在物質文明和精神文明建設中，我們在理論上又不斷面臨這五個問題。因此研究這些問題必定體現出某種東方與西方，傳統與現代的思想沖突的思想的交融。本文的目的是試圖創立一種新的觀點和新的視野來討論上述這些問題。不過，國內雜志限制論文字數一般不超過一萬字，所以本文不可能全面討論上述問題，只討論第二個問題即霍布斯問題。
　　人們常說，我們不應也不能超越社會經濟狀況來考察道德問題。其實，這個問題對于我們來說，更準確地說應該是這樣一個問題：我們不能越過人類的基本經濟事實即人類基本行為來討論倫理問題。那么，基本的經濟事實或人類基本行為是什么呢？這就是：每一個人都是自利的（Self-interested），即要實現自己利益最大化或最優化的“理性人”或“經濟人”。現在絕大多數經濟學家都承認全部經濟學的出發點就是自利的經濟人，它通過市場“看不見的手”的調節而有利于并不是他們想去追求的公共利益。現在我們的問題是：自利的個人之間怎樣能夠通過相互的交往，建立健全的倫理規范而自覺成為一個高尚的人、一個純粹的人、一個有道德的人、一個脫離低級趣味的人和一個有益于人民的人呢？這個百思不得其解的問題就是“經濟人”怎樣能夠變成“倫理人”的問題，在歷史上首先由霍布斯以最尖銳的方式提出來，在討論市場經濟與精神文明建設時我們又千百次地遇到這個實質上的霍布斯問題。“霍布斯問題”（Hobbesian Problem ）這個提法是社會學家帕森斯于1949年和哲學家哈貝馬斯于1981年首先使用的，它可以表述為“社會秩序（以及倫理規范）是怎樣可能的問題”（〔1〕，p.280）也可以表述為個人利益的價值判斷如何能夠推出社會義務價值判斷？簡單地說就是“經濟人”怎樣能夠變成“倫理人”的問題。歷史上有一些哲學家，如亞當·斯密、洛克、帕森斯和哈貝馬斯認為，經濟人是不能推出倫理人的，“義務……是不能僅僅從目的理性的論述中推論出來”。（〔1〕，p.282）因此倫理規范應該另尋它的出發點。亞當·斯密找到了“社會同情心”洛克找到了“人類天生的平等”，某些馬克思主義者找到“公有制”和“階級友愛”等等。
　　但是，許多哲學家還是認為霍布斯問題有解，可以從經濟人的前提中推出倫理人的結論，這樣來解決霍布斯問題的，可以找出三個有代表性的理論模型。這就是，近代的霍布斯“自然狀態”模型；現代的羅爾斯“原始狀態模型”和最新的“博弈論模型”。
　　　　　　一、霍布斯的“自然狀態”模型
　　霍布斯（T.Hobbes,1588—1679）認為，在倫理規范出現之前，人類之間處于自然狀態：（a）自然創造人類，人類在能力上大致平等，這就產生希望的平等，若兩人欲求相同的排他的事物，這事物不能為他們共享，于是他們便成了敵人。（b）每個人都有這樣的自然權利，為了保全自己的生命和為了自己利益得到滿足，對世界上每一樣事物，甚至包括別人的身體在內，都有處置的權利，將它們當作達到自己目的的手段，而不當作目的本身。這樣人們彼此必然相互摧毀、相互掠奪，包括剝奪別人的生命、財產與自由，就發生了“一切人反對一切人的戰爭”。于是人類的生命是“孤獨的、貧窮的、兇殘的、充滿恐懼的和短促的”。
　　問題如何解決呢？人們為了自己個人的利益，必須訂立防范人們之間過度相互競爭的社會契約。正是導致一切人反對一切人的那個同樣的自利驅動力，即對生命安全和舒適生活的渴望與欲求以及對“死的恐懼”（它的作用如同牛頓萬有引力對物體的作用一樣），導致人們走出自然狀態，達成和平共處、相互合作的協議：每個人放棄別人同樣愿意放棄的那一部分權利，滿足于具有他所答允給別人同樣多的自由。這就產生所謂平等權利、平等自由的正義原則。理性能幫助我們制定這樣的原則。當然這里暗含了一個前提，那個協議的各方都是自由人，沒有人能將自己的意志強加于他。這樣權利的平等轉讓就是社會契約。由此而產生“公道（正義）”、“互惠”、“和順”、“寬恕”、“正直”、“慈愛”、“平等”等道德信條。總之，霍布斯力圖從自利的個人（Self-intersted individals）即生命自我保全（Slef-preservation）這個公理中推出一切道德原則，正像物理學家從牛頓的萬有引力中推出一切行星運動規律一樣。
　　但人是自利的，誰來保證人們不為了自己的利益而撕毀協議？霍布斯認為，這就需要一個有絕對權威能使臣民絕對服從于它的政府來監督協議的執行，對違反協議者進行懲罚與制裁。他稱這個政府為“利維坦”，即圣經記載的“海上怪獸”，是至高無上的“上帝代理人”。可是組成政府的那些人也是自利的，他們有了權力更加可以胡作非為，誰又來監督政府秉公辦事并尊重人權？霍布斯沒有回答這個難題，他陷入困境，用系統論的語言來說他由于只相信“他組織”不相信“自組織”，便不能解決這個問題。而用邏輯學的語言來說，自利的個人或“經濟人”這個前提是不能單獨地、完全地推出各種倫理原則或倫理人的論述的，必須附加上某些輔助前提或輔助假說才能解釋人類的基本的倫理現象。自利的個人是道德推理的必要而非充分的條件，是第一的原則而非唯一的原則。霍布斯強調這個前提是完全正確的。他的錯誤在于當他不能由“經濟人”單獨導出“倫理人”的時候加進了一個強權政府，不但不能消除這個邏輯鴻溝，而且加深了這個鴻溝。
　　荀子的《禮論》與霍布斯的《利維坦》有異曲同工之妙，都視自利的個人為倫理禮義的出發點。荀子曰：“禮起何也？曰：人生而有欲，欲而不得，則不能無求，求而無度量分界則不能不爭。（這就是霍布斯所說的“兩人欲求相同的事物而成為敵人”）爭則亂，亂則窮。（這就是霍布斯的“一切人反對一切人的戰爭”，結果導致“人類的生命的孤獨、貧窮、兇殘、恐怖和短促”）先王惡其亂也，故制禮義以分之，以養人之欲，給人之求。使欲必不窮乎物，物必不屈從于欲，兩者相持而長，是禮之所起也”。荀子在這里也和霍布斯一樣強調從個人長期利益出發來看禮義倫理，強調君主政府在維護倫理的作用，不過中國古代哲學沒有西方近代哲學那種論證的嚴密邏輯的推理，因而它的缺點與矛盾并沒有暴露得那么明顯。
　　　　　　二、羅爾斯的“原初狀態與無知之幕”模型
　　美國哲學家約翰·羅爾斯（John Rawls,1921—）于1971 年寫了劃時代的倫理學著作《正義論》。《正義論》可以看作是解決霍布斯問題的又一個理論模型。它的基本概念是原初狀態與無知之幕。所謂“原初狀態”是這樣的一些初始條件，由此可以推出倫理關系的正義原則。這些初始條件主要有三個：①有限的資源，即“資源的中等程度的匱乏”。②人們只關心自己的利益不關心他人利益，這就是存在著“互相冷漠”（mutually disinterested）的理性人。③這些理性人在“無知之幕”（the veil of ignorance ）遮蓋下要對建構社會基本制度的原則進行理性選擇。
　　理性選擇：所謂無知之幕就是假定每個人都不知道自己的出身和社會地位，也不知道自己的財富、能力和智慧，以及將來自己在社會上落入什么處境的概率。在這種不確定性的因而任何個人都沒有什么優越性也沒有什么偏見的公平競爭條件下對社會構造的正義原則進行選擇，人們都必然傾向于思想保守，按決策論中的“最大最小原則”（ Maximin rule）進行選擇。就像如果你在“無知之幕”的遮蓋下，不知道自己是男人還是女人，你大概會選擇男女平等的原則而不會選擇男人可以壓迫女人的社會，因為你也有50％的概率做女人。
　　這樣，選擇的結果，必定是兩個正義原則：（1 ）所有的社會基本價值，包括自由和機會、收入和財富、自尊的基礎都要平等地分配；（2 ）除非對其中一些價值（如社會的和經濟的價值）的不平等分配大體上有利于社會上處于最不利地位的人。
　　羅爾斯模型的優點在于，他用一個假想的“無知之幕”代替了霍布斯的現實的強權政府，作為輔助假說從理性的、自利的個人出發。推出了一系列基本的道德原則，如平等的自由、機會平等、最不利者也受益，應幫助弱者，也許還有功利效率原則等。在內容上比霍布斯更加具體，在論證上和辯護上比霍布斯更加嚴格。但揭開了無知之幕的現實人為何能接受這些原則呢，這仍然是一個沒有很好解決和解釋的問題，而且特別值得一提的是，羅爾斯將他的（A）平等的自由，（B）機會平等，（C）最不利者也受益（福利原則）和（D）功利原則等幾個原則機械地對立起來，將它們按字典式進行排序，認為平等的自由原則永遠優先于機會功利原則，而機會平等原則又永遠優先于福利原則，而福利原則永遠優先于功利原則。“前者對于后者來說就毫無例外地具有一種絕對的重要性”。（〔2〕，p.40）用優先邏輯的符合（P表示優先）來表示，這就是：

├（APB）∧（BPC）∧（CPD）

　　
　　把它作為一個公理與他的兩個正義原則相并列以解決幾個正義原則之間可能發生的價值沖突問題。字典式排序在實際上與社會的許多實際情況不相符合，因而造成許多不能消化的反例。而在理論上，羅爾斯的倫理系統帶有強烈的本質主義的傾向，認為人類倫理行為一定存在著一個最高的原則或本質，這就是兩個正義原則，其他的原則都可以唯一地由它推出或受它支配。這一點與功利主義的方法論沒有兩樣，只不過功利主義認為一切倫理原則都只能由功利原則作為最高原則加以推出。用系統論的語言來說，羅爾斯的倫理自組織系統，沒有足夠的靈活性與多元化，沒有幾個不同的價值序參量（例如功利、正義、仁愛等）的競爭與協同的變化。
　　羅爾斯的正義原則與中國傳統哲學中的“義”的概念屬于同一種類型，而功利原則的中國傳統哲學的“利”的概念比較接近。儒家的“重義輕利”，孔子的“君子喻于義，小人喻于利”，孟子的“王！何必曰利！亦有仁義而已矣”以及荀子的“以義制利”，都類似于羅爾斯的正義原則以字典式序列優于功利原則。他們與羅爾斯同樣提出了類似的問題，有比“利”（功利）更高的道德原則嗎？他們的回答是：有！這就是“義”（正義的原則）。
　　　　　　三、博弈論模型
　　二次世界大戰后興起的博弈論，討論的是理性人的選擇與相互對策問題，被譽為“社會科學的統一場論”。運用它來解決霍布斯問題，可以看出經濟人是怎樣能夠變成倫理人的。本文的主要工作，就是運用博弈論來解決經濟人變成倫理人的問題，運用博弈論力圖將功利主義和道義論、功利原則和正義原則統一起來。
　　案例：典型的案例是囚犯困境。不過該案例討論的是二人合作作案被緝捕后的招供還是不招供的理性選擇問題，用以討論倫理關系的形成雖沒有邏輯障礙但有心理障礙，我將它改為A、B兩個原始人合作捕殺猛獸。如A在戰斗中逃跑待B擒得猛獸后又可坐享其成，因而對A 的利益來說這個對策的得分可記為10分。而B留下孤軍作戰，雖也有捕獲猛獸之機會但也有被猛獸咬傷之危險，權衡得失這個對策對B 的利益來說可記為0分。A、B同時逃跑，利用這段時間去采集野果、野菜之類，雖然沒有肉食但也不是一無所獲，故二人在記分上均記為2分。而如果A、B 都堅守陣地合作戰斗，可將猛獸打死，均分其肉，各記得分為6分。這樣在這個不確定的博弈中，A與B均有兩種對策：1.逃跑，2.合作。他們的支付矩陣如下：

　　　　　A[,1]（逃跑）　　A[,2]（合作）B[,1]（逃跑）│（2，2）　　　（10，0） │B[,2]（合作）│（0，10）　　　（6，6） │

　　
　　這在博弈論中叫做二人不確定性非零和博弈。
　　就個人來說，最優選擇是什么？是逃跑還是合作呢？以A為例，如果B逃跑，A當然要選擇逃跑（即方案A[,1]，這里A可得2分），否則他會得到0分。如果B采取合作態度，堅持戰斗，則A 還是采取逃跑方針為佳。因為我逃跑此時可得10分，比堅持戰爭時得分6分還要大。同理B也采取了同樣的方針，同樣的對策。結果：A也逃跑，B也逃跑，大家只各得2分。很明顯，從這個矩陣來看，如果A、B都采取合作的方針，大家都會得到6分。顯然后者才是最佳的（optimal）選擇方案。這就是說，從個人角度看的最優方案，從整體角度看不是最大而是比較差的方案。這就是困境Dilemma就是“悖論”（系統論將它稱為“整體悖論”）。這里個人理性與整體理性發生矛盾。個人理性的結果，導致整體非理性，即支付函數值為（2，2），不是最優。而要獲得整體的理性（6，6）導致個人的非理性（不是最優）的選擇。這里，逃跑的方案代表A、 B 不受任何約束可以為所欲為，相當于霍布斯的自然狀態。其結果是人類處于一種悲慘世界，即霍布斯所形容的貧窮、孤獨、兇殘、恐懼和短命的人生。當然它的得分很低，相當于這里的（2，2）。而A、B都堅持合作表示形成道德規范的狀態，道德規范約束大家走向共同合作，其結果，整體利益達到最大化，即6＋6＞10＋0＞2＋2，相當于一種功利主義的目標。而不采取一方逃跑一方合作的方地，則相當于不采取損人利己的“解”，即不平等不正義方案A[,1]B[,2]或A[,2]B[,1]，這相當于“平等的自由”和“平等的權利”，和將別人看作是目的而不只是看作手段的原則。
　　這樣，“囚犯困境”或“合作狩獵”的支付矩陣的各個值的組合便有了它的倫理意義，可以寫成如下的定性形式：

A　　　　　　 A[,1]　　　　　　　　　　 A[,2]　BB[,1]　個人理性:自然狀態　　　　不正義的選擇:權利　　　 或原始狀態　　　　　　　　的不平等狀態B[,2]　不正義的選擇:權利　　　　集體理性:功利主義　　　 的不平等狀態　　　　　　　和正義原則

　　
　　現在的問題是：如何解決個人理性與集體理性的矛盾，使具有個人理性的人過渡到具有集體理性的人呢？如何從選擇A[,1]B[,1]方案進展到A[,2]B[,2]的方案呢？博弈論的現代成就證明，這就是自利的個人經過重復多次的博弈的結果。這時自利的個人追求的并不是在某一次博弈中期望的得分最大，而是多次博弈中期望得分的總和為最大。1980年博弈學家羅伯特·艾克羅特用電腦計得在二人多次博弈中，對于個人來說最優方案不是“總是不合作”而是“第一次合作，以后各次依對方的對策，一報回一報”即這次你合作了，下次我回報以合作，上次你“逃跑”、不合作，我也回報以不合作。不過，從理論上講，這里所謂“多次博弈”指的是“無限次博弈”。不過從實際上講，無限次博弈是不可能的。只要足夠地多，就會接近這個極限。在這里，個人采取這個方案，有一個摸索、學習，包括思想境界的提高的過程，一旦大家摸索到這個方針，就相當于大家在A[,2]B[,2]的決策上穩定下來。這樣個人理性就轉化為集體理性。“經濟人”就變成了“倫理人”，倫理規范便因此而形成。為什么這樣說呢？
　　（1）通過多次博弈，人們通過學習，認識到必須采取基于回報的合作方針，通俗地說，這就是從合作的愿望出發，人不利我，我不利人；人若利我，我必利人。當然，人不利我，我不利人，這句話并沒有利他主義的含義。但是從合作愿望出發，人若利我，我必利人，這句話就包含了互惠性的利他主義、仁愛思想的出現。沒有這種互惠利他主義，個人的長遠利益的實現是不可能的，社會的和平與合作是不可能的。
　　（2）通過多次博弈，人們的相互關系的對策在A[,2]B[,2] 區穩定下來，就意味著人們從追求自己的短期利益最大化的目標轉變到追求長期利益最大化的目標，再轉變到追求共同利益最大化的目標，這里包含了一個從手段轉變為目標的過程。共同利益最大化本來是達到個人利益最大化的手段，現在手段變成目的。這就是功利主義和集體主義的產生。
　　（3）通過多次博弈，人們相互之間默契了不采取A[,2]B[,1]與A[,1]B[,2]的方案。這就意味著摒棄不正義的原則。這就是正義的原則和平等的人權的起源。
　　當然，以上的典型案例，說明功利原則與正義原則在同一個案例中同時被選擇。博弈的案例是很多的，我們也可以設計一些案例說明理性人在這里只選擇正義原則。例如在“合作狩獵”案例中，如果A[,2]B[,2]方案的支付函數值為（4.5，4.5），則這個選擇只是正義原則，而不是功利原則，因為既然A[,2]B[,1]與A[,1]B[,2]的總功利10＋0＞4.5＋4.5，即大于A[,2]B[,2]方案的總功利值。按功利原則應選擇A[,1]B[,2]或A[,2]B[,1]，但從上表可見它現在作為不正義的方案被摒棄了。可見不同的倫理原則，可以通過不同的博弈而被選擇。
　　這樣從理性的、自主的自利個人的前提出發，不需要附加政府的外部作用，也不需要附加無知之幕等其他的輔助假說，只需要附加上多次不確定性博弈的條件便可以推出“倫理人”的各種倫理規范論斷。倫理的社會契約是通過多次博弈而產生的。多次博弈的理論模型將功利主義、仁愛主義和正義論三者統一起來，這個集體理性和倫理規范的統一起源并不是依靠政府的外部強制（當然外部強制不是沒有必要，它加速了一種客觀必然性的實現），而是通過博弈過程的一系列學習和自我教育的內部過程而實現的。霍布斯問題就這樣解決了。當然倫理學并不是數學的問題，博弈論倫理模型概括了現實生活中通過自組織而形成倫理規范的各種社會系統。如通過核軍備競賽而達到的核裁軍形成國際核倫理規范；通過國家之間的政治、經濟和軍事較量而形成和平共處的國際關系；通過企業之間污染環境的博弈而形成保護環境的倫理規范，終于使功利原則、仁愛原則與環保原則四項基本原則統一起來。這些都是博弈論的關于“倫理人”形成過程的活生生案例。在改革開放中，我們常常埋怨市場經濟（及其“經濟人”）導致道德滑坡或道德淪喪。其實這是“經濟人”通過多次博弈而轉變為“倫理人”的道德爬坡過程，這是一個自發的又是自覺的過程。這個在尋求個人長期利益最大化的博弈中不斷摸索、不斷學習而進入倫理新境界的過程，顯然包含了一種新的倫理關系臨產的痛苦，我們不應該一概將這個過程出現的負面現象說成是改革開放和市場經濟帶來的沉重社會代價。馬克思說：“一個社會即使探索到了本身運動的自然規律，它還是既不能跳過也不能用法令取消自然的發展階段。但是它能夠縮短和減輕分娩的痛苦。”
　　在中國古代文化中，有許多博弈論的思想。比較突出的是孫子兵法。孫子認為，在國家之間的利益沖突中，最佳的決策并不是一方將對方消滅，而是求得長治久安，要避免兩敗俱傷的局面。孫子說“夫用兵之法，全國為上，破國次之；全軍為上，破軍次之；全旅為上，破旅次之；全卒為上，破卒次之；全伍為上，破伍次之。是故百戰百勝，非善之善者也。不戰而屈人之兵，善之善者也”。孫子的說法可以理解為通過博弈達到和平與合作是國家采取的最佳決策。
　　最后，借此機會我要感謝陳曉平教授，他在《自然辯證法通訊》雜志1999年第5期上，撰文批評了我的《現代科學與倫理世界》（1999 年湖南教育出版社版）一書，特別是批評了我所主張的環保原則、功利原則、正義原則和仁愛原則不能相互還原而組成相互獨立的健全社會的四項基本倫理原則這個論點，認為這是一種“整體的非本質主義”、“用不一致原則作為一個系統的公理或出發點，這個‘系統’已經不成其為系統了”。不過，陳曉平教授在他的論文中并沒有指出四項基本原則之間有任何不可消解的邏輯矛盾，相反，他也同時承認這四項基本原則，只不過他認為這四項原則都可以從功利原則推出罷了。我不知道他的“不一致原則”這句話是什么意思，是指內容上的不一致呢？還是指邏輯上不相容呢？如果是后者，則我不知道四項原則“不一致”的結論從何而來，而且既然“不一致”，陳曉平教授又怎樣能夠從功利原則將它們統統推出？這樣他的功利主義一元論豈不“也不成其為系統了”嗎？我覺得他的一元功利主義倫理學在邏輯地位上并不比我的多元系統主義倫理學好多少。現在我進一步用博弈論說明了四項基本倫理原則在發生學上的統一起源，似乎有利于理解四項基本倫理原則的一致性與相容性，并有助于建立包容功利主義和道義論而由超越功利主義和道義的統一倫理理論。
　　〔收稿日期〕1999年11月
自然辯證法通訊京85～89B2科學技術哲學張華夏20002000博弈論是當代數學的一個很重要學科。它應用于社會科學，被譽為“社會科學的統一場論”，而霍布斯問題是倫理學和科學倫理學的關鍵問題。本文的目的，是力圖運用博弈論來解決霍布斯問題，說明經濟人怎樣能夠成為倫理人，說明功利、正義、仁愛、環保等道德原則怎樣通過理性人之間的博弈而產生，并由此指出多元的系統主義的倫理學在邏輯地位上并不亞于一元論的功利主義倫理學，以此來回應陳曉平教授對我的批評。霍布斯問題/原初狀態與無知之幕/博弈論張華夏，山西大學，太原030006　　張華夏（1933—），山西大學科學技術哲學研究中心教授。作者：自然辯證法通訊京85～89B2科學技術哲學張華夏20002000博弈論是當代數學的一個很重要學科。它應用于社會科學，被譽為“社會科學的統一場論”，而霍布斯問題是倫理學和科學倫理學的關鍵問題。本文的目的，是力圖運用博弈論來解決霍布斯問題，說明經濟人怎樣能夠成為倫理人，說明功利、正義、仁愛、環保等道德原則怎樣通過理性人之間的博弈而產生，并由此指出多元的系統主義的倫理學在邏輯地位上并不亞于一元論的功利主義倫理學，以此來回應陳曉平教授對我的批評。霍布斯問題/原初狀態與無知之幕/博弈論

網載 2013-09-10 20:58:29

[新一篇] 華文文學研究的新趨勢　　——關于第九屆世界華文文學國際研討會的思索

[舊一篇] 歷史小說創作筆談寫出歷史人物的精神世界