關于概率要素和統計學要素在游戲設計中的運用(中)

>>>  技術話題—商業文明的嶄新時代  >>> 簡體     傳統

  《關于概率要素和統計學要素在游戲設計中的運用(上)》從三個方面講述了概率要素和統計學要素在游戲設計中的運用,本篇就從實例告訴你統計和概率在進行游戲設計中所起到的輔助作用。


  四、舉例論述游戲設計蘊含的概率學原理
  

  下面是答題時間!

  問題1. 假設你正在設計一款全新MMORPG游戲,你設定當玩家消滅一只怪獸時,特殊道具Orc Nostril Hair將有10%的出現幾率。某位測試者回饋稱,他消滅20只怪獸,發現Orc Nostril Hair 4次,而另一位測試者則表示,自己消滅20只怪獸,沒有發現Orc Nostril Hair。這里是否存在編程漏洞?

  問題2. 假設你正在設計游戲的戰斗機制,決定植入一個重擊機制。若角色進行成功襲擊(假設是75%的成功幾率),那么他就可以再次發動進攻。若第二次襲擊也成功,那么玩家就會形成雙倍破壞性(2x)。但若出現這種情況后,你再次進行襲擊,且這次襲擊也獲得成功,那么破壞性就上升至3倍(3x)。只要襲擊都獲得成功,你就可以繼續發動新的進攻,破壞性就會繼續成倍提高,直到某次襲擊出現失敗。玩家釋放至少雙倍(2x)破壞性的幾率是多少?玩家形成4倍(4x)或更高破壞性的幾率是多少?

  問題3. 你決定在最新杰作RTS-FPS-電子寵物-運動混合游戲中植入賭博迷你游戲。此賭博迷你游戲非常簡單:玩家下注紅寶石,賭硬幣會出現正面,還是反面。玩家可以在勝出的賭局獲得同額賭注。你會將硬幣投擲設計成公平程式,但你會向玩家提供額外功能:在屏幕右側顯示最近20次的硬幣投擲結果。你是否會請求程序員引入額外邏輯運算,防止玩家利用此20次投擲結果列表,以此摧毀你的整個游戲經濟體系?

  我們將在文章末尾附上這些問題的答案。

  游戲設計師——復興人士&非專家


  如今設計師這一職業要求各種各樣的技能。設計師是開發團隊的多面手,需要消除美工和編程人員之間的隔閡,有效同團隊成員溝通——或者至少要學會不懂裝懂。優秀設計師需要對眾多知識有基本的了解,因為游戲設計是各學科的隨機組合。

  我們很常聽到設計師爭論線性或非線性故事敘述、人類心理學、控制人體工學或植入非交互事件序列中的細節內容;你很少看到他們深究微積分、物理學或統計學之類晦澀科學的梗概內容。當然依然存在Will Wrights這樣的人士,全心致力于天體粘性物及動態城市交通規劃。但多數人都會在遇到方程式時選擇退縮。

  概率學+統計學=杰出成果

  概率學(P)和統計學(S)是兩門對游戲設計師來說非常重要的復雜科學——或者至少對他們來說應該非常重要。它們之間的關系就像豌豆和胡蘿卜,但和那些美味的蔬菜一樣,它們不是同個事物。簡略來說就是:

  概率學:預測事件發生的可能性

  統計學:基于已發生事件下結論

  綜合起來,P和S讓你可以做到這些:同時預測未來和分析過去。這多么強大!但記住:“力量越強大,責任越重大。”

  P和S只是設計師工具箱中的工具。你可以且應該在設計游戲時充分利用它們,這樣游戲才會更具平衡性和趣味性。

  好事壞事接二連三

  P和S有許多厚厚的教材,本文并非這類教材的替代內容。

  這一系列的文章旨在讓你把握P和S的若干主要話題,主要圍繞設計師需投以關注的要點。

  這一部分主要談論針對游戲設計師的概率學。

  記住,成為多面手設計師并不意味著你需要變成這些領域的專家;你只要能夠唬弄其他人即可。

  建議:強化對“理論”、“編撰”和“分類法”的運用能夠促使合伙伙伴朝這些目標邁進。開發者不妨對各學科進行高談論闊。

  現在我們開始切入正題。

  概率學

  多數游戲都會在基礎機制中融入1-2個概率學元素。就連國際象棋也需要靠擲硬幣來決定誰執白棋。通常,我們將概率學機制稱作“隨機事件”。隨機一詞的意思也許是“完全隨機”,也許是“刻意隨機”。無論是《德州撲克》、《魔獸世界》,還是《炸彈人》,隨機事件都有融入它們的核心游戲機制中。

  概率學:這不僅是個不錯構思,還是個設計法則!

  你多半聽過“根據概率學法則”這樣的表述。這個短語的關鍵詞是“法則”。概率學圍繞的是無可爭辯的事實,而不是猜測。從學術角度來說,這就主要是概率論,但出于游戲設計目的,你完全能夠計算概率。當你投擲6面骰時,搖到“6”的幾率是1/6=16.7%—–假設這是次公正的“投擲”,骰子制作合格。16.7%不是猜測數值。這幾乎等同于事實(也許有人會從量子力學角度出發,認為16.7%不屬于事實。我的意思是,骰子可能會突然變形,進而不復存在,或者你查看骰子的不當方式曲解它原本的波動函數)。大家在概率學方面的多數錯誤理念都和認為概率學不是基于法則,而是基于近似值或指導方針的觀念有關。不要陷入這些誤區。下面我將談到幾個常見誤區,大家務必多加注意。

  獨立和相關事件

  我將先從一個重要特性切入,談論概率學的熱門話題:事件屬于獨立,還是相關。這你是計算概念前必須要把握的要點。

  獨立事件:事件的出現概率和另一事件發生與否無關。例如,投擲6面骰(事件1),然后再次進行搖擲(事件2),都是屬于獨立事件。第一次搖擲和第二次搖擲沒有任何關系。你在事件1的搖擲結果對事件2沒有任何影響。另一獨立事件的例子是,從一個牌組中抽出一張紙牌,然后再從另一個不同牌組中抽出一張紙牌。

  相關事件:一個事件的出現幾率和另一事件存在相關性。例如,從牌組中抽出一張牌(事件1),然后再從同個牌組中抽出一張牌(事件2)。第二次抽到王的幾率會受到事件1的影響(注:若你在事件1中抽到王,那么在事件2中抽到王的幾率就會受到影響,因為牌組中的王變少了)。

  條件概率

  概率學的一大益處是,能夠計算條件事件的概率——也就取決于其他事件發生概率的事件。例如,我過去一直玩傳統《戰錘》桌面游戲,游戲主要基于6面骰。根據“撞擊”圖表,若不熟練的戰士(配備低級的武器技能)和高級敵人配成一組,那么你就需要連續搖到兩次“6”,方能進行襲擊。那么連續兩次搖到“6”的概率是多少?

  先說重點,你需要先搖到第一個“6”(1/6的幾率),然后你得搖到另一個“6”(1/6的幾率)。若一個事件的發生取決于另一事件的成敗,那么你需要將二者的概率相乘,方能得到最終發生概率。在此,就是1/6 x 1/6 = 1/36,這就是你連續兩次搖到“6”的概率。

  通過這一新發現的條件概率,我們很容易進行瘋狂骰子投擲的幾率運算。你連續搖到4個“6”的幾率是多少?答案是1/6 x 1/6 x 1/6 x 1/6。或者更簡單的,(1/6)4 = .0008 = .08%。那么連續搖到10個“2”呢?(1/6)10 =相當小的百分比。


  逐步提高難度,在搖到“5”或“5”以上數字后,搖到“3”或“3”以上數字的幾率是多少?就是4/6 x 2/6 = 8/36 = 2/9 = 22.2%。

  迷信和均分謬論——“賭徒謬論”

  大家在概率學方面的一個常見錯誤觀念是,模糊獨立事件和相關事件之間的界限。這主要體現在如下模式:

  錯誤1:認為若上次搖到的是“5”,那么“5”出現的幾率就變小。

  錯誤2:認為若連續10次都沒搖到“6”,那么“6”出現的幾率就很高。這相當于認為,若“紅色”多次沒有在輪盤上出現,那么它很快就會出現。

  錯誤3:在投擲10次硬幣,8次出現正面,2次出現反面后認為,在接下來的10次投擲中,反面出現的幾率會更高,以實現“平均化”。

  所有這些都屬于“賭徒謬論”。從根本來說,這其實就是混淆獨立事件和關聯事件的概念。這一謬論的另一表現是,“我剛在賭輪盤中輸掉所有資金,因為概率法則違抗均分謬論”。這和鮮為人知的“賭場為什么允許我記錄輪盤旋轉結果?——顯然他們知道我將發現其中模式,打破輪盤謬論?”這一觀念存在密切關系。

  不要陷入這些誤區。搖擲骰子多次或旋轉輪盤都是屬于獨立事件,純粹而簡單。下面就來深入查看上述錯誤:

  錯誤1:通過6面骰搖到“5”的概率是1/6 = 16.7%。這從來沒有變過。這和你是否連續搖到8次“5”或很久都沒搖到“5”毫無關系。16.7%依然是個幻數。“骰子沒有記憶”是個慣用語,這完全正確。

  錯誤2:和上述內容相同。搖到“6”或轉到“紅色”的幾率和此前的搖擲或旋轉情況毫無關系。輪盤也沒有任何記憶。

  平均數定律遭到否決

  錯誤3也是個類似,但有所拓展的錯誤觀念:認為所有事件在長期范圍內都會“均衡化”——平均數法則。的確投擲硬幣1000次,你有望看到50%的正面,50%的反面。但這里沒有所謂的“校正”。若你投擲硬幣10次,有8次正面,2次反面,那么接下來的10次投擲沒有理由會出現更多反面。你也許會犯下哲學錯誤,認為“該出現正面”,甚至犯下更大錯誤,在此投入眾多資金。

  這里的要領是,若你投擲硬幣100萬次,你看到正面和反面的幾率都是50%。但不要認為正面出現的次數會和反面保持平均——其實它們可能會相差幾百次,或者甚至幾千次。記住,當正面出現次數比反面少1萬次時,二者的出現概率依然接近于50%/50%(注:準確來說,是49%/51%)。所以不要在此下賭注,認為8:2的正反出現概率會在隨后的投擲過程中得到“校正”。雖然從長遠來看,正反面的出現概率接近于50%/50%,但正反面各自的出現次數差距會隨投擲次數的增加而增加。

  反向概率

  我們很容易找到計算獨立或關聯事件出現概率的公式。但有時要計算更多相關概率就沒那么容易。一個需要你把握的重要概念是“反向概率”。計算反向概率,你需要判斷的是某事件沒有發生的概率,而不是它發生的概率。然后將1.0 (100%)扣除此數,這樣你就會得到你所要的概率數值。

  反向概率101:簡單例子

  假設你即將投擲一個6面骰。你投到“6”的概率有多大?雖然我們已經知道答案,這里我們將運用反向概率進行論證。你沒有搖到“6”的概率是5/6 ,因此你搖到“6”的概率是1–5/6 = 1/6,或是16.7%。換而言之,你沒有搖到“6”的概率是5/6,那么你搖到“6” 的概率是1/6。這毫無疑義。

  反向概率201:湊成同花順

  在某情況下,反向概率能夠幫你節省資金。那就是《德州撲克》,假設你在拼湊紅桃同花順,手中已有2張紅桃(公共牌有2張),然后還有2次抽牌機會。換而言之,若你下次抽到紅桃,那么你的牌組就是同花順。這出現的概率有多大?


  我們很容易就能算出紅桃在下張牌中出現紅桃的概率。“牌組”中還有9張紅桃沒被抽取(13-4=9,手中2張+公共牌2張)。牌組還剩47張牌(52-5=47,手中3張,公共牌3張)。因此,下次抽到紅桃的概率是9/47。若抽到的不是紅桃,那么隨后抽到的概率就是9/46(紅桃數量依然沒變,但總牌數減少)。

  唯一問題是,我們如何算出在兩次抽牌中抽到紅桃的總概率?我們很容易就會犯下這一錯誤,認為是9/47 + 9/46。但這并不正確。這和下述錯誤類似:認為6次搖到“6”的總概率是1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1.0 = 100%。遺憾的是,我們無法在搖擲6次骰子后100%搖到“6”。

  事實證明,通過反向概率解決這兩個問題要簡單得多。我們會這樣設問:“沒有抽到紅桃的概率是多少?”就第一次而言,概率是(47 – 9)/47 = 38/47。第二次的概率是(46 – 9)/46 = 37/46。根據條件事件方面的知識,我們很容易就能夠算出這兩個事件的發生概率。換而言之,我們需要算出兩次都沒抽到紅桃的概率,即38/47 x 37/46 = 65.0%。我們對湊成同花順的概率非常感興趣,所以我們將1.0扣去此數值,得到1.0 –0 .65 = 0.35 = 35%。所以湊成同花順的概率是35%。

  注意:搖骰子問題的計算方式也類似。6次中至少搖到1次“6” 的概率是通過計算沒有搖到“6” 的概率得來。在每次搖擲中,沒有搖到“6”的概率是5/6。因此,6次完全沒有搖到“6”的概率就是:5/6 x 5/6 x 5/6 x 5/6 x 5/6 x 5/6 = 0.33 = 33%。所以,至少搖到1次“6”的概率是1.0 –0 .33 =0 .67 = 67%。因此你將有2/3的幾率搖到至少一次“6” 。

  關于反向概率,我們需記住的是,有時算出事件未發生的概率要比計算它們發生的概率簡單得多。

  關于隨機數據生成器

  關于概率,數字游戲設計師須知的一點是:隨機數據生成器并不隨機。隨機數據算法需要“始值”,這是算式獲得自身原始數據,進行能夠帶來所謂隨機數據的循環運算的的基礎。很多時候,程序會取樣CPU鐘點,或類似于始值的數據注:這能夠促使算法保持隨機性)。但對于包含眾多隨機數據生成內容的高強度游戲而言,有時這依然不夠隨機。讓我們以在線撲克供應商為例。玩家需要知道控制牌組重洗的隨機數據沒有潛在模式。在諸如這類的極端情況下:資金取決于收入,程序員需要進行精心設計,逐步以CPU熱量和函數作為始值,而不是鐘點。

  這里的建議是,數字游戲沒有真正的隨機數據。很多時候,這沒有問題,但若你的游戲融入眾多數據信息,就要留心其中模式。

  回到問答題目

  下面回到文章開始的問題。

  問題1. Orc Nostril Hair的出現概率

  在此情況中,兩位測試者的結果都處于概率范圍內。若每次消滅怪獸,發現Orc Nostril Hair(ONH)的基本概率是10% ,那么消滅20只怪獸后發現至少4次ONH的概率是13.3%。你也許會問,我如何得到這一數據?在此,我運用了一個高級概念,叫做二項分配,但這并不是本文的談論內容。

  在20次機會中發現0次ONH的幾率是由反向概率決定:

  在每次消滅怪獸后有10%的幾率發現道具意味著同時會有90%的概率沒有發現道具。

  在20次機會中沒有發現道具的概率是(.90)^20 = 12.2%。

  所以在20次機會中發現4次ONH的概率和發現0次ONH的相同。

  要判定自己是否真的需要担心編程漏洞,你需要更多信息。你需要測試者提供更多數據點,這樣你才能夠做出令人信服的結論。

  例如收集100個體驗回合的信息(注:每個回合包含100種技能)。這是一組龐大數據。若在這些體驗回合中,玩家發現ONH的概率多于或少于10%,那么你的回饋率可能存在漏洞。在這種情況下,你就應該加以關注。

  問題2. 2x-3x-4x+重擊

  形成至少2x破壞性也就是連續擊中兩次的條件概率:

  2x或更高破壞性的概率=0.75 x 0.75 = 56.3%

  4x或更高破壞性的概率=(0.75)^4 = 31.6%

  哇,玩家形成4x或更高破壞性的幾率是1/3。你需要修改游戲機制。或降低基礎擊中率,或提高連續重擊難度。

  問題3. 投擲硬幣

  這個問題是個設計粗糙的陷阱。首先,你通過向玩家呈現前20次投擲情況給予他們一定援助,然后你需要穩固自己的機制,防止玩家濫用。

  答案就是,告知玩家前20次投擲情況絲毫不影響硬幣投擲結果的50/50比例。這讓玩家陷入賭徒謬論中。

  我甚至建議當玩家在連續出現兩次“反面”后下注“正面”時,若他們勝出,支付他們少于同額賭注的資金。告訴他們,你們處于不公平的有利地位,知道“正面”定會出現。他們會信以為真。

  五、統計學在游戲設計領域的應用

  雖然統計學是一門基于數學的學科,但是它實在很枯燥!嚴格地說——如果你曾經不得不大量地研究雙邊置信區間、學生T檢驗以及卡方分布測試,有時你會覺得很難消化這些知識點。

  一般來說,我是喜歡物理學和力學的,因為很多時候只需簡單地分析一個事例,你就能核實現狀。當你計算蘋果從樹上落下的速度及方向時,如果你的結果是蘋果應以每小時1224英里垂直向上拋出,也就是實際上你已經在頭腦中核實過結果了。

  統計學的優勢在于易理解且具合理性;而劣勢在于它的奇特性。無論如何,這篇文章的話題不會讓你覺得枯燥。因為大部分的話題都是有形的、屬于重要的數據資料,你應有精力去慢慢摸索。


  統計學:黑暗的科學

  統計學是所有學科領域中最易被邪惡勢力濫用的科學。

  統計學可以同邪惡行徑相比較是因為在使用不當時,這門學科的分支就會被推斷出各種無意義或者不真實的裙帶關系(參見本文末尾的實例)。如果政治家或其它非專業人士掌控了統計學,那么他們就可以操縱一些重要決定。一般來說,基于錯誤總結的壞決策從來不受好評。

  也就是說,使用得當時,統計學無疑非常有用且有益。而對于強權勢力者來說,他們會將統計學應用于一些非法途徑,甚至是一些純粹無用的渠道。

  統計學——所謂的爭議

  我已準備好作一個緊湊的總結,然而我注意到維基百科已經對統計學作了定義,而且語言幾近詩歌體系。如下:

  統計學是應用數學的一個分支,主要通過收集數據進行分析、解釋及呈現。它被廣泛應用于各個學科領域,從物理學到社會科學到人類科學;甚至用于工商業及政府的情報決策上。(Courtesy Wikipedia.org)

  這真的是一段很感人的文章。特別是最后那句“用于情報決策上”。

  當然,作者忘記添上“在游戲設計領域”,但是我們原諒他對這一蓬勃發展的新興行業的無知。

  以下為我自己撰寫:

  統計學是應用數學的一個分支,它涉及收集及分析數據,以此確定過去的發展趨勢、預測未來的發展結果,獲得更多我們需了解的事物。(Courtesy Tylerpedia)

  如果將此修改為適用游戲設計領域,那可以如此陳述:

  統計學為你那破損的機制及破碎的設計夢指引了一條光明大道。它為你有意義的設計決策提供了穩定且具有科學性的數據。

  須知的事實

  統計學同其它硬科學一樣深奧且復雜。如同第一部分的內容一樣,本文只涉及一些精選的話題,我自認為只要掌握這些就足夠了。

  再次突擊測驗

  很抱歉我要采取另一項測試了。別討厭出題目的人,討厭測試吧。

  Q1a)假設有20名測試員剛剛完成新蝸牛賽跑游戲《S-car GO!》中的一個關卡。你得知完成一圈的時間最少為1分24秒,最多為2分32秒。你期望的平均時間為2分鐘左右。請問這個測試會成功嗎?

  Q1b)在同一關卡中你收集了過多的數據,在分析后得出這樣的結果:平均值=2分5秒;標準差=45秒。請問你會滿意這個答案嗎?

  Q2)你設計了一款休閑游戲,不久就要發行。在最后的QA階段,你分布了一個測試版本,然后收集了所有的數據作為試驗對象。你記錄了1000多位玩家的分數,還有100多位特殊的玩家的分數(有些玩家允許重復玩游戲)。運算這些數據可知平均分為52000pts,標準差為500pts。請問這游戲可以發行了嗎?

  Q3)你設計了一款RPG游戲,然后收集數據分析新的玩家從關卡1到關卡5的游戲進程會有多快。收集的數據如下所示:4.6小時、3.9小時、5.6小時、0.2小時、5.5小時、4.4小時、4.2小時、5.3小時。請問你可以計算出平均值和標準差嗎?

  總體和樣本

  統計學的基礎為分析數據。在分析數據的時候,你需要了解兩個概念:

  1.總體:

  總體是指某一領域中所有需要測量的對象。總體是抽象的,只在你需要測量時候才會具體化。比如,你想了解人們對某一特定問題的看法。那你就可以選擇地球上所有的人,或者愛荷華州所有的人或者只是你街道附近所有的人作為一個總體。

  2.樣本:

  樣本實際上就是指抽取總體中部分用于測量的對象。原因很明顯,因為我們很難收集到所有總體的數據。相對來說,你可以收集部分總體的數據。這些就是你的樣本了。

  正確性及樣本容量

  統計學結果的可靠性通常由樣本容量的大小決定。

  我們完美的想法是希望樣本容量就是我們的總體——也就是說,你想整個收集全部涉及到的數據!因為樣本越少,你就需要估計可能的趨勢(這是一種數學性的推斷)。而且,數據點越多越好;你最好能建立一個大型的總體而不是小型的。

  例如,相對于調查10000個初中生對《Fruit Roll-Ups》的感想,試想下調查人員能否詢問到每一個學生。100萬個的數目過于龐大,做不到的話,10萬個也不錯。仍然做不到,好吧,10000個剛剛好。

  由于時間和費用的關系,通常呈現出的研究結果都是基于樣本所做的調查。

  1.統計學的常識性規則:

  你無法通過一個數據點來預測整個趨勢。如果你知道我喜歡巧克力冰淇淋,你不能總結所有的Sigmans都喜歡巧克力冰淇淋。如果現在你詢問我家庭中的許多成員,然后你可能會得出關于他們的想法這類比較合理的結論,或者你至少知道是否能總結出一個合理的推斷。

  廣泛的分布圖(重點!)

  由于種種原因,只有《The Big Guy》可以解釋生活中的許多事情傾向于同一模式發展或者分布。

  最普遍的分布也有一個合理的名稱——“正態分布”。是的,無法匹配這一分布圖的都為非正態,所以有點怪異(需要適當避免)。

  正態分布也稱“高斯分布”,主要因為“正態”一詞聽起來不夠科學。

  正態分布也稱為“鐘形曲線”(又稱貝爾曲線),因為其曲線呈鐘形。


  鐘形曲線的突出特點是大多數的總體均分布在平均值周圍,只有個別數據散落在一些極限位置(主要指那些偏高或偏低的數據)。中間成群的數據構成了鐘的外形;而那些偏高數據或偏低數據分布在鐘的邊緣。

  我們周圍有上百萬的不同事例呈現出正態分布的景象。如果你測量了你所生活的城市中所有人的身高,結果可能呈現正態分布。這表明,只有少數個體屬于非正常的矮,少數個體屬于姚明那樣的身高,而大多數人會比平均身高多幾英寸或者矮幾英寸。

  鐘形曲線同樣極典型地適用于調查人們的技能水平。以運動為例——極少部分人在這一領域為專業人士,大多數的人都還過得去,只有少部分的人實在不擅長,所以沒有被選為隊員(比如我)。

  其它分布圖

  盡管正態分布圖很完美,但它并非我們周圍唯一的一種分布圖。只是它比較普遍地存在。

  比如有些其它的分布圖直接與賭博及游戲設計有關,只要看下扔骰子的概率分布圖,這種情況下出現了如下的d6情形及2d6情形:


  現在我想說的是第一個分布圖看起來一點也不像鐘形曲線,而第二幅圖開始呈現出了鐘的形狀。

  平均值

  這一小塊內容可以說是這篇冗長的文章中的一個小插曲。這塊自我指涉的小內容的存在只有一個目的:提醒你什么是“平均值”。這塊自我指涉且迂腐的小內容將被動地提醒你平均值是指一整套的數學平均數據。

  方差和標準偏差

  我們必須理解什么是方差和標準偏差,并且它們也具有許多有形的價值。除了能夠幫助我們做出有價值的數據總結外,這兩個術語還能夠幫助我們更明智地陳述分布問題。比起說“中間聚集了大量的數據點”,我們可以換個說法,即“68.2%的樣本是一個平均值的標準偏差”。


  方差和標準偏差是相互聯系的,它們都能夠測量一個元素,即分散數據。直觀地說,較高的方差和標準偏差也就意味著你的數據分散于四處。當我在投擲飛鏢時,我便會獲得一個較高的方差。

  我們可以通過任何數據集去估算方差和標準偏差。我本來應該在此列出一個方程式的,但是這似乎將違背“聽起來不像是一本教科書”的規則。所以我這里不引用公式,而是采用以下描述:

  標準偏差:樣本或人口統計的平均數值偏離平均值的程度。由希臘之母σ(sigma)表示。

  舉個例子來說吧,你挑選了100個人并測試他們完成你的新游戲第一個關卡分別用了多長時間。讓我們假設所有數據的平均值是2分鐘30秒而標準偏差則是15秒。這一標準偏差表明游戲過程中出現了集聚的情況。也就是平均來看,每個游戲過程是維持在平均值2.5分鐘中的±0.25分鐘內。從中看來這一數值是非常一致的。

  這意味著什么以及為何你如此在乎這一數值?答案很簡單。假設你不是獲得上述結果,而是如下結果:

  平均值=2.5分鐘(如上)

  σ=90秒=1.5分鐘

  所以我們現在擁有相同的平均值以及不同的標準偏差。這套數值表明玩家所用的游戲時間差別較大。90秒鐘的游戲時間背離了平均游戲時間。而因為游戲時間是2.5分鐘,所以這種偏差過大了!基于各種設計目的,出現這種較大的差值都不是設計師想看到的結果。

  而如果我們所說的游戲時間是15分鐘而標準偏差是90秒(1.5分鐘)的話差別變更大了。

  通過一個小小的標準偏差便能夠衡量一致性。標準偏差比率除以平均值便能夠獲得相關數值。就像在第一個例子中,15秒/150秒=10%,而在第二個例子中,90秒/150秒=60%。很明顯,60%的標準偏差真是過大了!

  但是并不是說較大的標準偏差“總是”糟糕的。有時候設計師在進行測量時反而希望看到較大的標準偏差。不過大多數情況下還是糟糕的,因為這就意味著數值的差異性和變化性較大。

  更重要的是,標準偏差的計算將告訴你更多有關游戲/機制/關卡等內容。以下便是通過測量標準偏差能夠獲得的有用的數據:

  1.玩家玩每個關卡的游戲時間

  2.玩家玩整款游戲的游戲時間

  3.玩家打敗一個經典的敵人需要經歷幾次戰斗

  4.玩家收集到的貨幣數量(游戲中有一個意大利水管工)

  5.玩家收集到的吊環數量(游戲中有一個快速奔跑的藍色刺猬)

  6.在教程期間時間控制器出現在屏幕上

  誤差

  誤差與統計結論具有密切的關系。就像在每一次的蓋洛普民意測驗(注:美國輿論研究所進行的調查項目之一)中也總是會出現誤差,如±2.0%的誤差。因為民意調查總是會使用樣本去估算人口數量,所以不可能達到100%精準。零誤差便意味著結果極其精確。當你所說的人口數量大于你所采取的樣本數量,你便需要考慮到誤差的可能性。

  如果你是利用全部人口作為相關數據來源,你便不需要考慮到誤差——因為你已經擁有了所有的數據!就像我問街上的任何一個人是喜歡象棋還是圍棋,我便不需要考慮誤差,因為這些人便是我所報告的全部數據來源。但是如果我想基于這些來自街上行人的數據而對鎮上的每個人的答案做出總結,我便需要估算誤差值了。

  你的樣本數量越大,最終出現的誤差值便會越小。Mo data is bettuh(越多數據越好)。

  置信區間

  你可以使用推論統計為未來數據做出總結。一個非常有效的方法便是估算置信區間。理論上來看,置信區間與標準偏差密切相關,即通過一種數學模式去表示我們多么確定某一特定數據是位于一個特定范圍內。

  置信區間:即通過一種數學方法傳達“我們帶著A%的置信保證B%的數據將處于C和D價值區間。”

  雖然這個定義很繞口,但是我們必須知道,只要具有一定的自信,我們便能夠造就任何價值。讓我以之前愉快但卻缺乏滿足感的工作為例:

  我過去是從事應力分析和飛機零部件的設計工作。如果你知道,或者說你必須知道,飛機,特別是商業飛機的建造采用的是現代交通工具中最嚴格的一種形式。人們總是會担心機翼從機身上脫落下來。

  作為飛機建造工程師,我們所采取的一種方法便是基于材料優勢屬性設置一個高置信區間。關于飛機設計的傳統置信區間便是“A基值許可”,即我們必須95%地確信裝運任何一種特殊材料都有99%的價值落在一個特定的價值區間內。然后我們將根據這一價值與可能發生的最糟糕的空氣條件進行設計,并最終確立一個最佳安全元素。

  當你真正想了解某種數據值時,置信區間便是一種非常有幫助的方法。幸運的是在游戲中我們并不會扯到生死,但是如果你想要平衡一款主機游戲,你便需要在設計過程中融入更多情感和直覺。計算置信區間能夠幫助你更清楚地掌握玩家是如何玩你的游戲,并更好地判斷游戲設置是否可行。

  不管你何時想要計算置信區間,備用統計規則都是有效的:越多數據越好。你的樣本中擁有越多數據點,你的置信區間也就越棒!

  你不可能做到100%的肯定

  這便引出了另一個統計規則:

  并不存在100%之說:你永遠不可能創造一個100%的置信區間。你不可能保證通過推論統計便能夠預測一個數據點具有一個特定的價值。

  當玩家在《魔獸世界》中挑戰任務時,唯一可以確定的只有死亡,稅金以及不可能找到最后的Yeti Hide。所以玩家只需要接受這些事實并勇往直前便可。

  濫用

  我在之前提過,統計是一種邪惡的技能。為了更好地解釋原因,我寫下了這篇彈頭式愛情詩:

  十四行詩1325:美好的統計,讓我細數下我濫用你的每種方式:

  1.誤解

  2.未明確置信區間

  3.只因為不喜歡而丟棄了有效的結論

  4.基于有缺陷的數據而做出總結

  5.體育實況轉播員的失誤——混淆了概率和統計錯誤

  6.基于一些不相干元素做出總結

  誤解

  人們一直在誤解統計報表。我知道,這一點讓人難以置信。

  未明確置信區間或誤差

  置信區間和誤差是信息中非常重要的組成部分。在過去30天內有43%的PC擁有者購買了一款可下載的游戲(誤差為40%)與同樣的陳述但存在2%的誤差具有巨大的差別。而如果遺漏了誤差,便只會出現最糟糕的情況。我們需要始終牢記,小樣本=高誤差。

  只因為偏見而丟棄了有效的結論

  操作得當的話,統計數據是不會撒謊的。但是人們卻一直在欺騙自己。我們經常在政治領域看到這類情況的出現,人們總是因為結論不符合自己預期的要求而忽視統計數據。在焦點小組中亦是如此。當然了,政治領域中也常常出現濫用統計結論的現象。

  基于有缺陷的數據而做出總結

  這種情況真是屢見不鮮,特別是在市場調查領域。你的統計結果總是會受到你所獲得的數據的影響。如果你的數據存在缺陷,那么你所獲得的結果便不會有多少價值。得到有缺陷的數據的原因多種多樣,包括失誤和嚴重的操作問題等。提出含沙射影式問題便是引出能夠支持各種結論(就像你所希望的那樣)的缺陷數據的一種簡單方法。“你比較喜歡產品X,還是糟糕的產品Y?”將快速引出反彈式回答,如“95%的費者會選擇產品X!”

  體育實況轉播員的失誤

  體育實況轉播員可以說是當今時代的巫醫。他們會收集各種統計,概率以及情感,然后將其混合在一起而創造出一些糟糕的結果。如果你想看一些圍繞著沒有根據的結論的統計,你只要去觀看一款足球比賽便可。

  例如一個廣播員會說“A隊在最后5局游戲中并未阻止B隊的進攻。”這種模糊的結論是關于A隊不大可能阻止B隊的進攻,而不是他們在最后5局游戲中成功阻攔了B隊。但是你也可以反過來說——也許他們將會這么做,因為他們之前從未阻擋過任何對手。

  但是事實卻在于根本不存在足夠的信息能夠支持任何一種說法。也許這更多地取決于一種概率。阻擋進攻的機會是否就取決于一方在之前的游戲中是否這么做過?它們也許是兩種相互獨立事件,除非彼此間存在著互相影響的因素。

  但是這并不是說所有體育運動的結論都存在著缺陷。就像對于棒球來說統計數據便非常重要。有時候統計分析也將影響著球的投射線或者擊球點等元素。

  最終還是取決于數據:當你擁有足夠的數據時,你便能夠獲得更好的統計結論。棒球便能夠提供各種數據:每一賽季大約會進行2百多場比賽。但是足球比賽的場次卻相對地少了很多。所以我們最終所獲得的誤差也會較大。但是我并不會說統計對于足球來說一點用處都沒有,只是我們很難去挖掘一些與背景相關的有用數據。

  基于一些不相干元素做出總結

  人們始終都在誤解統計報表。比起使用對照關系,我們總是更容易推斷出一些并不存在的深層次的關系。我最喜歡的一個例子便是著名的飛行面條怪物信仰。

  我們是否能夠開始解答問題了?

  問題1的答案—-關卡時間

  這一問題的答案很簡單:你未能獲得足夠的信息去估算平均值。因為在1:24與2:32范圍中波動的價值并不意味著它們的平均值就是2分鐘。(單看這兩個數值的平均值是1.97分鐘,但是我們卻不能忽視其它18個結果!)你必須掌握了所有的20個結果才能估算平均值,除此之外你還需要估算標準偏差值。

  問題2的答案—-后續關卡時間

  這時候你可能不會感到滿足,因為標準偏差值過高了,超過平均值的40%。如此看來你的關卡中存在著過多變量。同時這里也存在著一些可利用的潛在元素,并且技能型玩家能夠發揮其優勢而造福自己。或者,你也可以嚴厲懲罚那些缺少技能的玩家。而作為游戲設計師,你最終需要做的便是判斷這些結果(居于高度變量)是否符合預期要求。

  問題3的答案—-標準偏差值

  統計只是你所采用的一種方法,你同時還需要懂得如何進行游戲設計。如此,過于接近的計數分組使得我們總是能夠獲得一個較低的標準偏差值(500/52000=1%),這就意味著你所獲得的分數幾乎沒有任何差別,也就是說在最終游戲結果中玩家的不同技能并不會起到任何影響作用。而當玩家發現自己技能的提高并不會影響游戲分數的發展時,便會選擇退出游戲。

  所以在這種情況下你更希望看到較高的標準偏差,如此游戲分數才能隨著技能的提高而提高。

  問題3的答案—-游戲時間

  可以說這是一個很難獲取的數值,不過它卻說明了數據收集中的一個要點:你需要警惕那些看起來是錯誤的數據。就像0.2小時看起來就有問題。也許這是排印錯誤,或者是設備故障所造成的,誰知道呢。但是不管怎樣在進行各種計算之前你都需要堅定不移地說服自己0.2小時是一個有效數據,或者你也可以選擇將其丟棄而基于剩下的數據點進行估算。

  其它有趣的內容

  為了控制本文篇幅,我不得不略過許多有趣的主題。我只要在此強調理解統計不僅能夠幫助你更好地進行游戲設計,同時也能夠幫助你做出消費者決策,投票決策或者財政決策等。我敢下23.4%的賭注保證我所說的內容中至少有40%的內容是正確的。

  對于設計師而言,統計能夠幫助他們獲取來自有記錄的游戲過程(樣本)的相關數據,并幫助他們為更大的未記錄的游戲過程(人口統計)做出總結。

  在實踐中學習

  例如在我剛完成的游戲中,我便是通過記錄游戲過程的相關數據,并圍繞著源自這些數據的平均值和標準偏差去設定游戲挑戰關卡。我們將中等難度等同于平均值,較容易的等同于平均值減去一定量的標準偏差,而較困難的等同于平均值加上一定量的標準偏差。如果我們能夠收集到盡可能多的數據,我們的統計便會越精準。

  就像概率論一樣,當你的項目范圍變得越來越大時,統計也會變得越來越有幫助。很多時候你可以通過自己的方法進行摸索,而無需使用任何形式理論。但是隨著游戲變大,用戶群體的壯大以及預算的擴大,你便需要做好面對一個不平衡,且完全憑直覺的游戲設計中存在固有缺陷的準備。

  你需要牢記的是,統計和概率都不可能為你進行游戲設計,它們最多只能起到輔助作用!


游戲邦編譯



GameRes游資網 2015-08-23 08:57:22

[新一篇] 程序員要有持續產出

[舊一篇] 蘋果再度出擊 嚴厲審核應用提交關鍵詞
回頂部
寫評論


評論集


暫無評論。

稱謂:

内容:

驗證:


返回列表