關於推薦系統的5個問題

2009年一月,在阿姆斯特丹舉行了一個名為Recked的活動,活動由Wakoopa和Strands主辦,旨在討論工程師們感興趣的推薦系統。在活動介紹的內容中,提出了一些公司對於建造有效的推薦系統必須解決的幾個問題。

1.缺少數據

或許推薦系統面臨的最大問題,是需要大量的數據,以便能形成有效的推薦。現在能給出最好的推薦的公司正是那些擁有大量數據的公司:google,amazon,Netflix,last.fm,這並不是巧合。下圖是Recked活動中Strand's的演示文檔,如該圖所示,一個好的推薦系統首先需要類目(種類)​​數據(從目錄或者其它形式得到),然後系統必須捕獲並且分析這些用戶數據(用戶行為),然後,再應用神奇的算法工作。分析越多的類目(種類)​​和用戶數據,系統越有可能生產好的推薦。但是,這又是一個蛋和雞的問題:要形成好的推薦,首先需要有大量的用戶,這樣才能得到大量的推薦數據。

2.不斷變化的數據

這個問題由Clicktorch公司(一家做“智能推薦”的公司)的CEO:Paul Edmunds 在ReadWriteWeb網站的評論中指出。他在評論中指出:系統通常偏向於舊的數據而難以有新的改進。

這方面的一個例子是David Reinke在StyleHop(一個時尚愛好者的社會團體)的博客上寫道:“過去的用戶形為並不是好的工具,因為趨勢總是在不斷變化”。很明顯,運算方法將很難或者不可能跟上時尚趨勢。時尚-挑戰人們-我接受時尚-依靠值得依賴的有時尚意識的朋友和家人,把衣服推薦給他們。

David Reinke說,“類目(種類)​​推薦行不通,因為有太多的產品屬性,而每個屬性(比如價錢,顏色,風格,面料,等等)在不同的時候對於消費者的重要程度都是不一樣的”,他指出,社會化推薦可能可以“解決”這個問題。

3.不斷變化的用戶喜好

提出這個問題的仍然是Paul Edmunds,他認為問題在於:今天自己瀏覽amazon時是會有特定意圖的,明天或許會有另一個特定意圖。舉個典型的例子:有可能某天我會上amazon為自己買本書,但第二天我到amazon的原因可能是要為姐姐找一份生日禮物。

對於用戶喜好,推薦系統也可能錯誤的標註。華爾街雜誌2002年有一篇文章“如果TiVo覺得你是個同性戀,這就是把你標註成同性戀的方式”

4.不可預知的類目(事項)

我們都知道,Netflix花100萬美元來獎勵能提升推薦引擎質量10%的人。我們注意到對於一些古怪(特別)的電影會有一些問題,有一些電影觀眾對它又愛又恨,比如:大人物拿破崙。這種類型的電影是很難去做推薦的,因為用戶對它們會有各種反映而且無法預計。

音樂中就有很多種這樣的類型。你能猜出來某個作者同時是卡彭特和金屬樂的愛好者嗎? Last.fm可能需要這種推薦

5.這個東西是複雜的

我們可以很簡明的描述,但是從下面這張Strands的演示PPT截圖可以看到,哪怕是最簡單的推薦,也需要涉及到非常多的參數和變量(而且我們想像到的這些只涉及到系統表面)

到目前為止,有很多公司都已經建立起了用戶滿意程度較高的推薦引擎系統—amazon,Netflix,google這些名字跳入腦中。但是相對我們想到的這些少數成功的案例,還有其它成百上千的網站和應用,都在尋找推薦新產品和新內容給用戶的道路上掙扎。的確,在ReadWriteWeb,我們更希望讀者在網站上點擊發現更多其它的內容,我們使用很多種插件和方法來達到這個目的,但目前我們並不滿意

問題之外

推薦引擎可能發生的問題有很多,比如:給出太多最低級公共屬性的推薦;對於長尾的支持不夠;只推薦顯而易見的內容,等等。

譯文出處(http://www.thinktag.cn/archives/73

特別注意:本站所有轉載文章言論不代表本站觀點,本站所提供的攝影照片,插畫,設計作品,如需使用,請與原作者聯繫,文章轉自alibuybuy

Comments are closed.