騰訊信鴿大數據:移動遊戲流失用戶預測

隨著遊戲市場競爭的日趨激烈,越來越多的遊戲運營服務選擇借助大數據挖掘出更多更細的用戶群來進行精細化,個性化運營,從而更好的抓住用戶,獲得更大的收益。在遊戲運營中,無論是流失挽留,還是拉新,以及付費用戶預測都是遊戲運營的重要內容。

本文將著重介紹手遊用戶的流失預測。對於遊戲運營者,如果能夠盡早的發現可能流失的用戶,盡早的有針對性的對這些用戶進行適當的幹預,從而最大限度的延長用戶在遊戲中的停留時間,使得遊戲運營者獲得更大的收益。

本文中介紹的手遊流失預測主要依托於騰訊信鴿這個平臺,為這個平臺提供精準定位即將流失用戶的功能。騰訊信鴿是專業的移動應用推送平臺,支持百億級的通知/消息秒級觸達移動用戶。開發者可以方便地通過嵌入SDK,通過API調用或者Web端可視化操作,實現對特定用戶發送通知/消息,提升用戶活躍度,挽回潛在流失用戶,並實時查看推送效果。我們在這三面都有深入研究,取得瞭不錯的效果。

需求的挑戰

1.海量的用戶行為

目前該套流失預測系統,每天最高時承接著480億條上報的用戶行為記錄。



2.海量的用戶

在已經接入的遊戲中,每天活躍著一億左右的用戶。

3.模型的通用性

流失預測的實際應用中,不僅僅包含瞭公司內的遊戲,還有公司外的遊戲,以及各種各樣的應用。每個應用上報的自定義事件更是各不相同,但算法還要統一接入。

4.應用接入壓力

目前實際已經介入100多款公司內遊戲應用,幾乎囊括瞭公司內大部分主力手機遊戲,包括《天天炫鬥》,《天天德州》等。

鑒於上述的挑戰性,結合瞭騰訊大數據精準推薦平臺以“數據+算法+系統”的3方面打法,我們針對手遊也總結瞭一套通用的業務流失預測模型。

t01

系統–TRC平臺

TRC的全稱是Tencent Real-time Computing,是大數據精準推薦平臺專為海量數據實時處理而構建的提供基礎計算能力的服務平臺,從全流程的實時計算體系的角度看,整個TRC由核心的平臺支撐層和擴展的平臺應用層構成。

平臺支撐層主要包括實時數據接入、實時數據處理、實時數據存儲;平臺應用層主要包括實時算法預測,實時模型訓練,實時效果統計,實時系統監控實時數據展示。總體結構如所示:

t02

TRC平臺經過兩年多的現網運營,已經逐步成熟穩定,該平臺每天支撐公司2,000多億實時數據接入,每天26,000多億次實時計算,每天5,000多億次數據訪問,已經在廣點通廣告推薦,電商物品推薦,視頻推薦,新聞推薦,微信業務性能監控並實時統計等產品中大規模使用。

數據

在機器學習,算法建模中,數據是輸入,也是起點。數據的質量的高低,優劣,將直接影響著最終的算法效果。對於數據的研究和分析,往往耗費瞭研究者大量的時間和精力。

在流失預測模型運用到的數據中,存在著優勢和劣勢。

優勢是數據量大,每天高達百億級別的用戶行為記錄,日活躍一億左右用戶。並且有著豐富的用戶行為。比如,登錄,打怪,升級,加血,得分,領取金幣等,還有著更為豐富的各個遊戲,應用的自定義事件。

劣勢也非常明顯。雖然行為豐富,但是每個應用上報的具體數據內容無法規范統一,特別是自定義事件更無法控制,同時,還要達到無論是公司內部手遊,外部手遊,還是各類應用都要模型通用,隻能從這眾多豐富的數據中抽取它們共性的且有效的特征。

在本算法中,考慮到,通用性,有效性,並且易拓展性,具體抽取的特征有:登錄天數,登錄頻次,最後登錄時間,登錄時長,等級等特征。

算法

在本次流失預測的建模中,采用瞭LR模型。在這裡簡單介紹一下LR模型。Logistic regression (邏輯回歸)是當前業界比較常用的機器學習方法,用於估計某種事物的可能性。比如某用戶購買某商品的可能性,某病人患有某種疾病的可能性,以及某廣告被用戶點擊的可能性等。

Logistic回歸為概率型回歸模型,是研究分類觀察結果y與一些影響因素x(單變量,多變量都可以)之間關系的一種分析方法。

在流失預測模型中,具體輸入的用戶特征為登錄天數,登錄頻次,最後登錄時間,登錄時長,目前等級等特征,輸出為用戶的流失可能性。同時,通過算法的結果的準確率,和召回率來評價算法效果。

流失預測的整體流程如所示,從公司內外部遊戲以及各類應用中抽取各類用戶,日常的登錄天數,登錄頻次,最後登錄時間等特征,以及最後的流失狀況,來訓練LR模型。然後根據每天用戶相應特征,使用訓練好的模型來進行預測,得到最可能流失的用戶。

t03

算法效果

基於玩傢的在線時長,使用頻率等特征,建立流失用戶預測模型,精準預測潛在流失用戶。在公司外遊戲《美人國》的ABTest中,預測覆蓋率超過85%,準確率超過91%。利用信鴿對該用戶群推送針對性的營銷活動,回流率比隨機推送提升120%。

在騰訊內部XX遊戲的ABTest中,我們的算法的預測覆蓋率達到79.847%,準確率達到85.646%。利用信鴿對該用戶群推送針對性的營銷活動,回流率比隨機推送提升326%。通過實踐證明:充分利用大數據的優勢,幫助遊戲大幅提升玩傢留存率,同時減少對玩傢的騷擾,保障用戶體驗。

遊戲市場的競爭日趨激烈,新遊戲產品增速逐漸放緩,越來越多的遊戲運營開始借助於大數據,機器學習,來挖掘出更多更細的用戶群,從而更有針對性的進行運營活動,能夠幫助遊戲大幅提升玩傢留存率,減少對玩傢的騷擾,保障良好的用戶體驗。

Comments are closed.