電腦比朋友更懂你？

簡體傳統

　　榮獲 2014 年奧斯卡最佳原創劇本獎的電影《她》中，描述了這樣一個科幻愛情故事：心思細膩而深邃的男主角愛上了他的操作系統。通過分析他的數字記錄，他的計算機比其他人（包括他長期的女朋友和最親密的朋友）能更好地理解他，并對他的想法做出回應。電影中的故事雖發生在 2025 年，但這是否可能會成為現實呢？

在電影《她》中，主角愛上了他的操作系統 OS1。圖片來源：blastr.com

　　最近一項研究顯示，計算機模型作出的人格判斷的確比熟人（包括朋友、家庭成員、配偶和同事等）的判斷更準確。研究論文^[1]于 1 月 13 日發表在《美國科學院院刊》（PNAS）上。果殼網科學人就此對論文作者，劍橋大學的吳又又以及斯坦福大學的米哈爾·科辛斯基（Michal Kosinski）進行了采訪。

　　電腦和朋友，誰更懂你？

　　在社會生活中，判斷別人的個性是一項非常重要的技能，因為個性是隱藏在人們行為和情緒背后的一個關鍵驅動因素。人們常通過個性判斷來做出決定和計劃，比如和誰交朋友、結成伴侶、信任誰、聘用誰或者選誰作總統等等。一開始的判斷越準確，后面做出的決定也越正確。

　　之前人們認為，準確的個性判斷來自人類大腦的社會認知技能。但是近來研究表明，計算機模型可以通過人類行為的數字記錄，對個性做出準確判斷^[2-3]。那么，計算機和人類的判斷，到底哪個更準確呢？

　　研究中共收集了 86,220 名志愿者的信息。志愿者被要求填寫有關大五人格模型的個性調查問卷，進而得出了他們在開放性、盡責性、外向性、宜人性和神經質這 5 個方面的個性特征。

　　計算機做出的人格判斷則是以 70,520 名志愿者的臉書點贊數據為基礎的，而點贊被認為可以有效地預測人的個性和其它心理特征^[2]。比如，給某個品牌或者產品點贊可以代表消費者的偏好和購買行為；音樂相關的點贊可以透露音樂品味；點贊的網站則可以代表網頁瀏覽行為。而來自他人的判斷則由志愿者的好友完成，他們需要填寫由 10 個項目組成的個性量表。

　　通過將參與者的自我評定與計算機及他人的判斷進行比較，研究人員首先檢測了這兩種判斷的自評-他評一致性（外部判斷和自我評定的一致性）。因為自評-他評一致性受人際關系的持續時間和形式的影響很大，因此研究人員又進一步將他人分成了不同的小類別，分別為朋友、配偶、家人、同居者和同事。

以計算機為基礎的人格判斷的準確性（y軸）與點贊數目（x軸）之間的關系。紅線顯示的是計算機對大五人格判斷的平均準確性，他人判斷的準確性也在這條紅線上標出。因為該樣本中個體的平均點贊數為 227，由此得到計算機在這個點贊數目下的平均準確性為 0.56，這比來自他人判斷的平均準確性（0.46）要更高，而與配偶判斷的準確性（0.58，這也是最好的他人判斷準確性）相近。在研究中，可以看到隨著點贊數目的增加，計算機的判斷準確性也在增加；當點贊數超過 500 時，可以看到該判斷準確性可達 0.66。而且，相比于其它個性特征，以點贊為基礎的模型對于開放性的判斷有著最高準確性。圖片來源：研究論文

　　結果顯示，計算機模型僅需要 100 個點贊數據，其準確性就可以超過他人的平均值（藍點）；和同事、朋友/同居者、家人和配偶的判斷相比，計算機模型分別需要 10、70、150 和 300 個點贊，就可以在準確性方面超過他們。

　　為什么點贊可用來判斷個性？

　　研究人員表示，點贊可以代表行為、態度和偏好。比如，有著高開放性的志愿者傾向于給薩爾瓦多·達利（Salvador Dali）、冥想或者 TED 演講點贊；而具有高外向性的志愿者則傾向于給派對、史努基（Snookie，真人秀明星）或者舞蹈點贊。

　　談到計算機判斷比人類判斷更準確的原因，吳又又解釋說：原因之一是計算機掌握有大量和人格有關的數據信息；另一個原因則在于計算機能通過模型和算法，非常理性地處理這些信息。相反，人類可能會受到認知偏見的影響，而無法以最好的方式處理這些信息。打個比方，我們的結果顯示，喜歡英劇《神秘博士》的人是高度內向的；而對普通人來說，即使你知道你的朋友在看《神秘博士》，你可能也無法得出這個結論。

通過建立模型分析 Facebook 上的點贊信息，我們能得到關于一個人人格的很有預測。合理的使用這項技術，將會使更多人受益。圖片來源：wordpress.com

　　吳又又告訴科學人：這次研究中，我們僅僅檢測了大五人格特征。我們認為計算機模型完全有可能在判斷其他人格特征方面，也有更好的表現。但是，我并不會說計算機模型就一定會更好，因為對某些特征做出正確判斷需要更微妙的線索，而這在數字環境中是沒有體現的。我們可以拿情商（EQ）作為例子說明這一點：對人來說，利用面部表情或者肢體語言等信息來判斷他人是否在社交中感到尷尬，或者是否對別人產生了共情是相對容易的；但至少從目前來看，這種信息在數字環境中是很難體現的。

　　吳又又表示，該研究最實際的應用包括將該算法應用到有著臉書使用者身上當然是在他們同意的情況下。這樣，就可以繪制出使用者的個性特征圖譜，而這個圖譜可以進一步在其他方面使用，例如

市場營銷，廣告商可以因此提高產品的推薦并對他們的市場信息進行量身定制（比如說，蹦極公司可能要針對那些更愿意嘗試新體驗的人）；
工作推薦，HR 專員能根據人格特征選擇合適的求職者（如為會計工作選擇有條理的人）；
網上約會，一般來說，性格相似的人更容易成對。

　　針對計算機個性判斷是否存在風險，論文作者之一的科辛斯基告訴我們：個性判斷和其他任何技術一樣，在道德上是中立的。就像一把刀，我們可以用它來改善生活，也可以用它來傷害我們自己。當然，我們需要小心行事，因為這項技術涉及的范圍很大，很多人能從中受益，或受害。因此，我們應該采取一些政策或者技術，來將風險降到最低。在此，有兩個原則可以指導我們：透明和受控。首先，我們需要幫助使用者知道，他們有哪些個人數據正被如何使用及可能被如何使用；其次，我們需要讓使用者能夠控制他們的數據，并決定這些數據可以被用來做什么。做到這兩個方面在技術上并不困難，但是落實它們則需要使用者意識到問題本身的存在也許還需要加上政策制定者的推動。（編輯：球藻怪）

　　PS：這個結論對點贊狂魔可能不適用

　　參考文獻：

Wu Youyou, Michal Kosinski, and David Stillwell. Computer-based personality judgments are more accurate than those made by humans.PNAS.http://www.pnas.org/cgi/doi/10.1073/pnas.1418680112.
Kosinski M, Stillwell D, Graepel T. Private traits and attributes are predictable from digital records of human behavior.PNAS. 110(15):5802–5805.
Kosinski M, Bachrach Y, Kohli P, Stillwell D, Graepel T. Manifestations of user personality in website choice and behaviour on online social networks. Mach Learn. 95(3):357–380.