在遊戲行業中,越來越多的關於數據分析的內容和觀點也井噴式提出,“數據驅動下的精細化運營”,“玩傢群體的定量研究”,“移動遊戲數據分析體系”等等概念的提出,可以看出遊戲的研發和運營過程中,對數據分析的需求是無窮無盡的,相應的,對數據分析的討論也是各抒己見。而盲目過度依賴數據,或者主觀的解讀數據,帶來的損失則是無法估計的。以下,我將結合自己的工作經歷,闡述以下數據指標會騙人和遊戲數據分析中的幾個誤區。
1.未理解數據定義,盲目比較數據
近來,同行們樂於去關註關於行業各類型遊戲的benchmark,諸如S級遊戲的次日留存,S級遊戲的ARPU,S級遊戲的ACU/PCU等等一些運營常見指標,在我看來,比較是數據的價值之一,是用來衡量產品優劣差距度量最直接的方法,而數據比較是建立相同的數據采集方法和數據指標計算方法上的。所以在比較數據前,請先明白benchmark的計算標準及數據采集方法,這樣才能體現數據比較的意義。
2.過度依賴分析方法,沉迷於數據建模過程
作者在大學期間,讀的便是統計學專業,大學參加過數學建模比賽拿到較好的名次,也做過一系列諸如BP神經網絡,貝葉斯決策樹或是聚類分析等項目,在剛接觸遊戲數據分析時,十分興奮,便用瞭各式各樣的方法對數據進行分析。漸漸的我發現,在實際工作中,數據分析並不像學術研究那樣嚴謹,更需要對數據表現作出快速判斷,不需要在每次分析前都去驗證樣本群體是否符合某種統計分佈,也可能不需要用“人工神經網絡”等“高科技手段”去預測產品將來的用戶數,甚至給出“A>B”的結論時也用不著做“顯著性檢驗”,考驗得更多的是對業務的理解的把握能力。所以在開展數據分析工作過程中,切勿過度依賴分析方法,而應重視遊戲業務的把握。
3.數據是客觀存在的,切勿主觀誤讀數據
對於在一線工作過一段時間的同行來說,做數據分析經常會走入這樣一個怪圈,在我們提取數據的過程中,我們會看到部分的數據表現,而且對各種各樣的現象都有瞭一些自身理解的結論,在這樣的思想指導下,總有方法去用數據去驗證自己的結論。在我看來,數據是客觀存在的,解讀數據也需要秉持客觀中立的態度,千萬需要避免為瞭自身觀點去解讀一份數據。
4.不明確數據分析目的,模糊分析需求,分析不完整,應該做一份300%的分析報告
明確分析的目的及需求,比如不要將核心用戶研究誤認為活躍用戶分析。產品經理跟你提出做一份COC的活動數據分析報告,去衡量活動效果,一般情況下,你會將活動前期,中期,後期的遊戲宏觀數據拿出來,然後畫圖看各個階段的表現,然後做出判斷。然後歡欣雀躍的拿著報告交給產品經理,這樣就覺得瞭事瞭。如果從一個數據分析師的角度看來,這樣的報告是很廉價的。別人提分析需求時,可能他有10個問題,但是隻給我們描述瞭3個問題,我們並不能簡單解決這樣3個問題,我們應該更多的是中立客觀的從多個角度去思考這樣一個問題,然後從產品自身,產品玩傢,產品運營等等多個角度,全面的去衡量這樣一個問題,去發現潛在機會,然後做出一份300%的分析報告,而不是100%。