TalkingData:遊戲數據分析流程

文/ 於洋 TalkingData高級咨詢總監

遊戲數據分析的流程

遊戲數據分析整體的流程將分為幾個階段,這幾個階段則是反映瞭不同企業數據分析的水平,從另一個角度,也是在解析作為一名數據分析人員究竟該如何參與到遊戲數據分析業務中,與之有關的遊戲數據分析師的工作我們將在1.4節重點闡述。

如圖1-2所示,對於遊戲數據分析系統及數據的利用,我們分為瞭五個階段,方法論、數據加工、統計分析,提煉演繹、建議方案。從工程技術、統計分析、數據挖掘以及用戶營銷幾個方面進行瞭覆蓋和研究。

數據
圖1-2遊戲數據分析流程

方法論



方法論是數據分析的靈魂,是解決問題的普遍原則,貫穿分析始終的思想指導。這個階段決定瞭我們如何埋點數據,如何設計分析指標,如何采集,如何組織數據。

方法論多數是將業務進行瞭抽象,形成瞭一套可以解決若幹業務問題的思路。就遊戲業務來說,從遊戲數據分析角度,目前已經存在幾套方法論,比如遊戲早期市場提及的是PRARA,在進入移動遊戲領域,以TalkingData的AARRR模型則提及得最多,這套方法論綜合瞭PRARA、網站分析、社交網絡分析等諸多分析的特色,結合移動遊戲市場的情況,加以整理並提出的。在後續的章節中,我們會重點介紹AARRR模型。

方法論存在的意義就是要去解決問題,是對於問題、目標、方法和工具的概述。一方面解決業務問題,另一方面則是分析思維的指導。在後續有關遊戲數據分析師的描述中,我們強調對分析思想的鍛煉及方法的駕馭,學會基於不同角度和領域去看待業務問題,這需要高度的抽象和概括能力。從圖1-2我們也可以看到,方法論的確立,決定瞭我們在遊戲數據分析方向上要解決的問題、采取的方法和使用的工具等。

當我們缺少這樣的體系支撐時,即使我們確立目標,但是在實踐操作時將會變得非常緩慢,效率低下。因為在整個的過程中,我們要完成遊戲數據分析的工作,需要開發人員、設計人員和運營人員的參與,當大傢無法在統一的思想和方法的指導下,就無法進行有效地任務分配和需求理解,進而導致今天我們看到這種現象:在很多的遊戲公司,運營人員與開發人員的溝通中頻頻會出現各種數據標準理解的不統一,分析功能開發得南轅北轍。這些問題的出現不僅僅是溝通的問題,更是對於遊戲數據分析的體系和思想未形成一致的認識造成的。在方法論的階段有如下的兩點是需要重點關註和解決的。

(1)業務需求

方法論是對業務需求的最高層級的抽象,涉及具體業務時,在方法論的指導下,我們需要對業務需求進行拆解,而這個階段,從數據分析的角度來看,就是該如何進行數據埋點。

數據埋點就是通過客戶端或者服務端,通過在某些遊戲位置追蹤玩傢遊戲行為而得到的相關數據。這些位置則是未來對特定業務分析的基礎數據支撐。比如,我們在進行用戶註冊分析時,需要在用戶註冊的相關代碼和邏輯位置進行數據采集點的設計,這樣當遊戲有玩傢參與時,我們就可以通過采集到的數據,進行整理,形成可計算的指標。

經過長期的發展後,基本上已經形成瞭一些特定的數據指標,而這些指標也可以涵蓋大部分的業務數據分析。多數時候,我們常常會苦惱於如何進行數據埋點,如何進行基礎的數據分析,實際上,我們通過一些行業通用的數據指標白皮書就可以在短時間內明確該如何進行數據的埋點和基礎數據統計分析,這方面可以參考TalkingData在2012年發佈的《移動遊戲運營數據指標白皮書》。

(2)指標體系

當我們形成瞭基本的數據指標後,我們要形成完整的指標體系,並且要建立在方法論的指導基礎之上。在多數情況下,指標具有很強的業務導向性和監測作用。比如在我們進行數據日報的制作過程中,我們就需要按照一定的邏輯組織我們的數據,用戶類數據,收益類數據,渠道數據等等。與此同時,在這些指標基礎之上,數據分析人員可根據需要,進一步加工和變換指標,從而完成深度分析,比如我們對於新增付費用戶的研究,用戶生命周期價值的探討等,就需要在基礎數據的指引下,進一步建立新的數據規劃和指標拆解。

這部分指標工作看似是最基礎的部分,但是最重要。理清瞭業務需求,我們需要基於目標驅動構建指標體系,在類似AARRR模型的指導下,整體構建並不會有太多的特殊性,但重要的一點是,所構建的指標體系需要能夠和業務匹配起來,比如更具業務需要,重點予以關註的指標數據,或者關鍵業務的評估需要微型的指標體系來實施。這一類是在方法論指導原則下完成的。

在指標體系中,指標重在理解和標準化,如果在構建指標體系階段,定義的指標標準不夠清晰,那麼在具體的開發實施階段,就會產生很多問題,最終造成瞭類似統計數據不準確等問題。此外,在此階段定義的指標不是越多越好,所以要加深對於指標的深入理解,借助數據分析來解決問題,而不是羅列數據,在構建的指標體系內,每一個指標都將具備實際的分析價值和能夠反映特定的問題,並且當問題得以解決時,我們還可以從該指標或者幾個指標的組合中評估效果。

數據加工

對數據進行處理使其最終變成信息,這個階段統稱為數據加工.在數據加工階段,我們重點要去解決的問題有兩點。

(1)業務理解

系統最終是需要技術開發的,在選定技術和工具之前,最重要的是要充分理解需求和標準定義。在開發人員完成開發後,如果發現其數據處理的結果並非是分析師或者業務人員所需要的,那麼就浪費瞭很多的時間和資源,因此是否形成一直的指標定義認識,是否明確統一需求,需要分析師、業務人員與開發團隊共同商議,形成統一的認識,否則將面臨重復開發,需求更改等等一系列的問題。在所有人員在這些問題達成一致後,接下來就要解決的是技術開發問題。

(2)技術開發

確立使用什麼技術和架構來完成整體的數據分析平臺的建設,這是需要技術人員去評估的,而評估的一個重要參考就是前一個階段所確立的內容,技術人員對於業務分析需要的理解,決定瞭未來構建的數據平臺的很多因素,比如高安全性、高效性、高可靠性、高可用性、高可擴展性和可管理性,等等。

在數據采集層級,我們需要解決數據的發送機制、采集內容和存儲方式等。就目前的移動互聯網遊戲來說,主要采取在遊戲客戶端植入統計分析SDK的方式來完成數據的采集,當然,在部分公司中,也采取瞭遊戲服務器端完成數據的采集。兩種方式各自具備優勢,通過SDK植入遊戲客戶端的采集方式,在有關遊戲用戶終端設備的信息,用戶會話時間等方面具備優勢,而通過服務器端的數據采集,則在遊戲內諸如等級分析、關卡任務分析方面具備優勢,但是對於遊戲用戶在客戶端設備上一些行為則無法做到采集和分析。比如,如圖1-4所示,在移動遊戲客戶端的錯誤日志中,多數情況下無法通過服務器端獲得的寶貴數據。

數據
圖1-4遊戲客戶端錯誤日志

而這些數據,經過采集後,則是可以快速瞭解目前產品的問題,比如新增用戶很多,但是活躍時間和留存質量很低,分析錯誤日志則是一個很好的方式。這一點在移動遊戲數據分析方面是非常必要的,因為移動遊戲環境和場景的多樣性,使得我們必須重視解決看似很小的問題。

在數據處理層級要對采集到的原始數據進行抽取、清洗和加載,對雜亂的數據進行標準化、映射、排重以及糾錯等操作,最終將數據加載到數據倉庫中。在這個階段需要完成的工作量是非常龐大的,尤其是在移動遊戲領域,當用戶終端的設備變得更加多樣,地域更加分散後,數據的處理工作相比之前的端遊和頁遊,變得更加的重要,依賴程度更高。移動遊戲需要更加快速的響應和迭代能力,當我們通過數據發現瞭遊戲在某些設備上存在問題時就要迅速的進行解決,而此時,關鍵任務在於我們如何發現這些問題並進行分析。我們需要依托設備的標準化和糾錯去發現不同用戶群的設備分佈情況。在同樣情況下,我們也可以分析比如付費用戶更加傾向哪些分辨率的手機,或者使用iPhone5的付費用戶的ARPPU是多少,這些分析都要依托於強大的數據處理能力才能夠實現。

在數據計算層級,要進行實時的運算,定義多維數據模型、業務模型,比如基於時間維度、地域維度、用戶群維度、區服維度和渠道維度等,按照小時、日計算任務,根據業務要求進行數據運算,並把結果集數據輸入到數據庫中。

在業務信息層級,則需要將經過采集、處理並計算的數據最後經過接口變成可被查詢的信息,如果從開發層面解釋,就是龐大的報表系統,即直接面向最終分析師的數據產品。

實際上數據加工階段的最終目的就是將數據轉化為可用的信息。從這點來看,第三階段的統計分析則是與業務信息階段是結合非常緊密的,統計分析要基於已經加工好的數據,進一步深入地透過更加多元的數據或者信息分析方法,挖掘特征。

統計分析

統計分析包含瞭統計和分析。統計分析是商業智能的一方面,商業智能應用還包括決策支持系統(DSS)、查詢和報告、在線分析處理(OLAP)、預測和數據挖掘,統計分析則是整理數據和分析數據的綜合。

此前我們需要收集數據,但是目的都是整理數據且最終要進行分析數據,數據向信息轉化的過程。為此需要描述數據的性質和研究數據關系,並通過一定的模型來變換角度解析數據內在的聯系,而如果整體系統的開發度更高,則可以就模型本身進行有效性的驗證。在部分公司提供的統計分析系統上,我們已經能夠看到部分的預測分析,這也是向下個階段提煉演繹的重要過渡。

對於遊戲數據分析師來說,我們需要學習的更多的統計的思想、方法和解題思路。統計分析最關鍵的就是要分析數據,因為對於經過整理和加工的數據,如何提煉有用的決策信息,一方面是依托於系統的數據采集和整理,另一方面則需要分析師最終進行分析才會發揮價值。分析師的最大要求就是理解每一個方法背後的原則、范圍和思想。統計學的思維將我們對於事物的解讀能力提升到瞭一個更高的層次。

在進行一些遊戲數據分析時經常使用集中趨勢或者離散程度的指標,而這些指標所代表的不隻是一個計算方式,更重要的是在最初誕生時,就是為瞭解決某一類問題而設計的解決辦法,這是我們在分析基於計算方法下分析數據所最需要關心的事情,比如在描述統計分析中,我們經常使用集中趨勢,它反映的是一組數據所有具有的共同趨勢。

統計分析階段對分析師來說是非常重要的考驗,尤其是基本的分析能力。當然,作為一名分析師隻具備在挖掘數據特征和分析數據方面的能力還不足以證明分析師的價值,數據分析本身是輔助決策的,因此,能夠挖掘提煉和演繹,與業務有效結合,形成結論則是非常重要的。所有的分析師不是為瞭分析數據而分析數據,崇尚數據,信仰數據,但不要盲目。

提煉演繹

事實上,每一次數據分析都要經過長期的準備和努力,曾有文章指出在整個數據分析環節中有80%以上的時間是在整理數據,所以如何有效形成方法和經驗就變得更加重要。

可以預見的是,當數據分析由系統來實現時,我們需要對關鍵業務具備數據的歸納和業務分析的模型組織,比如在遊戲數據分析中,我們會針對鯨魚做分析,對留存做專門的分析。這些都是通過業務的提煉才得以實現的。

在很多情況下,經過積累,需要將一些重要業務和分析進行歸納,總結出長期可以使用的分析模塊和數據采集體系,如此當我們每一次面臨新遊戲需要數據統計分析時,則不需要更多的額外開發成本。

以移動遊戲統計分析為例,在經過不斷的業務提煉和模型演繹後,從分析角度來看,如圖1-6所示的幾個模塊是最為關心的。

數據
圖1-6遊戲數據分析模塊

以上是經過不斷的提煉總結出來的一些重要分析模塊,基於這些模塊,我們需要記錄和完成的數據采集,並且在參數設計上需要形成可以復用的接口。在如今移動遊戲市場,服務於第三方遊戲統計分析服務的平臺提供瞭標準的數據接口,從數據采集的角度,我們可以確立如圖1-7所示的標準統計接口。

數據
圖1-7遊戲數據采集標準接口設計

下面我們將通過TalkingDataGame Analytics在iOS平臺的數據統計接口設計的為例,來描述具體的具體設計方法,其中涉及的標準接口有6個。

(1)遊戲啟動和關閉

用於準確追蹤用戶的遊戲次數、遊戲時長和初始渠道等信息:

數據

(2)統計用戶賬戶

用於定義一個玩傢,更新玩傢最新屬性信息:

數據

(3)跟蹤用戶充值

跟蹤玩傢充值現金而獲得虛擬幣的行為,充入現金反映至遊戲收入中:

數據

(4)跟蹤用戶消費點

跟蹤遊戲中全部使用的虛擬幣的消費點,如購買道具、VIP服務等。

數據

(5)任務關卡或副本

跟蹤玩傢任務、關卡、副本情況。

數據

(6)任務自定義事件

跟蹤和統計任何期望分析的數據,如功能按鈕的點擊、填寫輸入框、廣告出發情況等。

數據

以上是從數據采集和具體分析兩個角度闡述瞭提煉演繹的重要性,作為分析師,其提煉演繹的能力不僅僅是完成分析,還在於優化和完善分析系統的結構和設計。這個階段的業務模型和分析師見解,一方面影響瞭下一步的方案形成和指導決策,另一方面,也決定瞭其提供的經驗在後續的產品運營過程中是否可以作為可持續使用的方法。

在西內啟所著的《看穿一切數字的統計學》有一句話:
“實際上分析結果本身並沒有價值,如何活用分析結果,最終得到的價值也是不同的。

價值的挖掘還體現在最終的建議和方案上,因為最終數據分析要以解決問題為先,建議方案則是最終訴求。

建議方案

前面幾個過程是從數據平臺、標準分析系統、產品運營和精細化幾個關鍵詞在描繪遊戲數據分析的流程,而數據分析的最終是要形成方案或者決策指導,因為分析結果體現不瞭價值,最終還是要和業務結合,真正體現價值的是如何運用結果。

建議方案就是解決如何有效利用分析結果。在很多情況下,你會發現最能夠體現利用分析結果就是在獲取用戶和經營用戶兩個方面。在獲取用戶方面,我們需要針對那些還不是我們用戶的用戶進行轉化,到達特定的用戶群,即那批我們真正想要轉化的人,而如何選擇受眾、選擇媒體需要充分利用分析結果。對於廣告主來說永遠希望投放效果最大化,對於媒體來說則是收益效果最大化,為此在最近的幾年我們看到瞭諸如DSP、DMP、SSP和RTB等概念的出現,一定程度上就是利用我們不斷豐富的數據和分析結果,不斷優化我們在廣告方面的投放,不得不說這印證瞭西內啟的那一句話。

另一點,從經營用戶的目的來看,因為每一個用戶的獲取都需要成本,在產品有限的生命周期內,期望與每一個獲取的用戶生命周期也足夠長久,如此可以獲取更多的價值。而這一點,在遊戲領域也被逐漸利用起來。

在以往的遊戲數據分析領域,我們會發現,經過數據分析後,方案一旦形成,我們很難將這個方案執行下去,並且無法評估最終的效果,因為在整個數據分析環節中,參與的部門的人員眾多,數據分析結果與方案執行往往很難做到一致。不過在最近的移動遊戲市場,已經有很多的公司或者分析師慢慢註意到這一點,因為移動設備可以更加精準地定位一個用戶,同時移動提供瞭更加方便和快捷的消息推送和內容下發機制,這使得我們至少從遊戲運營層面可以做到根據設備、地域、渠道、遊戲行為、付費行為等更加準確和快速地對目標用戶進行營銷,從一個層面已經可以做到數據分析結果的最大化利用。

比如一款遊戲,如果一個活躍用戶連續三天不進入遊戲,則從遊戲中流失的概率增加10%,此時我們就需要精確定位這樣一個群體,進行目標用戶的營銷和召回計劃。劃分的目標用戶如圖1-8所示。

數據
圖1-8目標用戶劃分

根據分析結果,最終通過A/B test等方式將運營消息和活動下發到用戶移動設備上,使得目標用戶的轉化得以提升。這是對數據分析結果的最佳利用,同時也是在不斷積累運營經驗,從長遠來看,會形成一系列的運營模型,從此不必在摸著石頭過河,也不必每一次運營活動和執行都是通過感性認知完成。

建議方案是整個遊戲數據分析的重要一環,因為最終我們還要進行效果的檢驗,並且通過和分析目標進行比較,是否達到瞭預期。整個數據分析過程其實一個循環,隻不過在這一步是把分析結果的價值通過一定的手段和方式發揮出來,最終經過檢驗和不斷修正,形成經驗和原則。遊戲數據分析師其實最需要突破的也恰恰是這一步,從方案執行的實時性和分析師職能的突破兩個方面來看,都將產生深遠的影響,當然剛才提到的借助於內容推薦隻是達成這一目標的一種方式而已。

from:TalkingData

Comments are closed.