2011年11月24日 星期四

[轉]搜索時代->推薦時代


最近在做推薦系統的專案,所以也搜羅了一些相關的綜述和資料。所謂的Web3.0,推薦系統就是典型的影子,你想要的資訊能夠主動找到你,並且在合適的時候出現在合適的地方,智慧。

其實推薦系統國內外研究都很熱,而且原型系統也有很多了。目前幾乎所有大型的電子商務系統,如AmazonCDNOWNetflix等,都不同程度地使用了各種形式的推薦系統。而近來以發現為核心的網站 正開始在互聯網上嶄露頭角,比如側重於音樂推薦的八寶盒,側重於圖書推薦的豆瓣等等。而且,去年國內也出現了第一家創業公司百分點科技。 那麼,到底什麼是推薦引擎,個性化推薦的前提、基本形式、具體應用有哪些呢?
推薦引擎利用特殊的資訊過濾(IFInformation Filtering)技術,將不同的內容(例如電影、音樂、書籍、新聞、圖片、網頁等)推薦給可能感興趣的用戶。通常情況下,推薦引擎的實現是通過將用戶 的個人喜好與特定的參考特徵進行比較,並試圖預測用戶對一些未評分項目的喜好程度。參考特徵的選取可能是從專案本身的資訊中提取的,或是基於用戶所在的社 會或社團環境。
在搜索領域,勝負已經非常明顯.在國外,Google遙遙領先,在國內,百度一枝獨秀。但是,起碼到目前為止,還沒有哪個推薦引擎是當之無愧的市場 領導 者。建造個性化的發現機制需要對目前網上所有的表述、分類及評價方式進行深入研究,這絕非易事。但是如果有公司可以把這樣的東西做到這些,那麼,這樣的發 現工具不僅僅可以改變行銷,甚至整個商業社會。
根據如何抽取參考特徵,我們可以將推薦引擎分為以下四大類:
基於內容的推薦引擎:它將計算得到並推薦給用戶一些與該用戶已選擇過的專案相似的內容。例如,當你在網上購書時,你總是購買與歷史相關的書籍,那麼基於 內容的推薦引擎就會給你推薦一些熱門的歷史方面的書籍。
基於協同過濾的推薦引擎:它將推薦給用戶一些與該用戶品味相似的其他使用者喜歡的內容。例如,當你在網上買衣服時,基於協同過濾的推薦引擎會根據你的歷史 購買記錄或是流覽記錄,分析出你的穿衣品位,並找到與你品味相似的一些用戶,將他們流覽和購買的衣服推薦給你。
基於關聯規則的推薦引擎:它將推薦給使用者一些採用關聯規則發現演算法計算出的內容。關聯規則的發現演算法有很多,如 AprioriAprioriTidDHPFP-tree 等。
混合推薦引擎:結合以上各種,得到一個更加全面的推薦效果。
隨著互聯網上資料和內容的不斷增長,人們越來越重視推薦引擎在互聯網應用中的作用。可想而知,由於互聯網上的資料過多,使用者很難找到自己想要的資訊,通過 提供搜索功能來解決這個問題是遠遠不夠的。推薦引擎可以通過分析使用者的行為來預測用戶的喜好,使用戶能更容易找到他們潛在需要的資訊。這裡以電子商務應用 中的推薦引擎為例來說明推薦引擎在互聯網應用中的重要性。


沒有留言: