Discuz! Board 
» 遊客:  註冊 | 登錄 | 會員 | 統計 | 幫助

RSS 訂閱當前論壇  

上一主題 下一主題
       
標題: 基於內容的過濾
 
admin
管理員
Rank: 9Rank: 9Rank: 9



UID 1
精華 0
積分 0
帖子 73
閱讀權限 200
註冊 2012-10-8
狀態 離線

用支付寶求購
基於內容的過濾

基於內容的過濾
另一個常用的方法,建議設計一個系統,是基於內容的過濾。基於內容的過濾方法的特點的信息和建議涉及的項目,打算換句話說,用戶喜歡(或電流)在過去的算法類似的項目正在審查的建議。被評為由以前的用戶,不同的候選項目,尤其是項目相比,推薦的最佳匹配。這樣一來,信息檢索和信息過濾的研究,有根。

默認情況下,這些項目具有在系統配置文件中的項目(即一組離散的特性和功能)。系統,一個項目的基礎上基於內容的用戶創建一個配置文件的權重向量。分攤單獨使用的各種技術,以顯示給用戶的每個特徵的重要性和內容可以從矢量的權重計算。另一種複雜的方法,如貝葉斯分類,聚類分析,決策樹,人工神經網絡來估計概率,用戶一定會喜歡的項目,而使用機器學習技術,如一個簡單的方法,使用的平均值矢量額定項目

平時喜歡或不喜歡“按鈕的用戶直接反饋的形式,(Rocchio反饋分類,或其他類似的技術)的重要性,使用高或低的權重分配給特定的屬性都可以使用。

使用基於內容的過濾系統了解用戶的行為,用戶的喜好為一個信號源的內容和其他內容重於形式,你可以用它們是否是一個關鍵問題有限公司系統建議的相同類型的內容,用戶已被使用的推薦系統中,從其他服務的不同類型的內容的值可以推薦比少得多。例如,從其他服務,如音樂,視頻,產品,和討論,是有用的,但不推薦新聞文章新聞搜索新聞搜索的基礎上,建議的基礎上就方便多了。這些建議Leiki產品化的內容。

正如前面所提到的那樣,潘多拉電台播放音樂的特點類似的歌曲,它的用戶提供的初始種子,和基於內容的推薦系統就是一個例子。這樣的目的的一個例子,大量的基於內容的推薦系統提供了推薦的電影,和一些腐爛的西紅柿,其中包括互聯網電影數據庫,尤金妮專輯04懷。

[編輯]混合推薦系統
在最近的一項研究中,在某些情況下,將成熟的協同過濾和基於內容的過濾,是一種混合的方法更有效。一種混合方法,結合他們,可以多種方式實現,取決於基於內容和合作單獨的預測進行了合作為基礎的方法,通過一個統一的方式(或反之亦然),在基於內容的功能通過添加一個完整的系統模型(建議審查[9])。在一些研究中,實驗純粹的協作和基於內容的技術和比較的性能,混合動力,混合動力法已被證明可以提供比單純的方法更準確的一項建議,即通過這種方式,冷啟動和稀疏的問題,為了克服一些常見問題推薦系統都可以使用。

看Netflix的圍下面是一個很好的例子,一個混合動力系統。用戶協同過濾,因為他們觀看或瀏覽習慣,以及影片比較高檔(基於內容的過濾)共同特徵的用戶提供建議。

編輯算法

推薦系​​統的設計到幾百所使用的算法。以下分節將突出舉幾個例子。

[編輯] K最近Naver的
推薦系​​統中最常用的k-最近鄰(K-NN)的方法的算法的。 [16] K-NN算法根據特徵空間上的屬性的對象分類,最近鄰法。分配給類的對象,該對象是最常見的k-近鄰(K是最小的正整數)K附近的鄰居,受到廣大使用排序。 k = 1時,則該對象被簡單地分配給類的近鄰。

[編輯] Pearson相關
Pearson相關係數為1和-1之間的一個值,使兩個變量X和Y(線性依賴)之間的相關性的度量。近一個特定的用戶可以通過社交網絡類似的口味和興趣的Pearson相關係數計算。往下到用戶的特定的前N個最近的根據由符號所收集的數據的相似性(重量)的程度上,可以預測用戶的偏好。

[編輯] Rocchio反饋相關濾波
Rocchio反饋分類可以追溯到20世紀70年代,適當的反饋。 [17] Rocchio反饋使用向量空間模型,假設的基礎上,大多數用戶將被標記為一個共同的概念適用或不適用的項目。以同樣的方式和建議,為改進用戶的具體條款強調,不強調,用戶的反饋將被用來限制搜索查詢(潘多拉)為了提高搜索引擎的召回是指一個用戶的查詢反饋,也許同樣的精度相關的和不相關的條款已被修改,包括任意比例。您可以輸入查詢,以及中央表達了一系列的權重是由相關和非相關的術語的數量。

[編輯]手機推薦系統

耕地的研究領域,在該領域的推薦系統,移動推薦系統之一。智能手機無處不在,它的個性化上下文敏感的建議已經能夠提供互聯網接入增加。推薦系​​統的研究經常需要處理比這更複雜,因為移動數據是一個特別困難的地區(這是嘈雜的,異構的,空間和時間上的自相關必要,驗證了一般性的問題,[18])。此外,移動的推薦系統遭受的建議並不適用於所有領域(例如,您可能無法使用它所有的成分和配方建議在該地區),這是不明智的可移植性問題。

是一個移動的推薦系統的一個例子,提供了潛在的有利可圖的行車路線城市出租車司機。定位系統[18],包括工作出租車司機卡紙路徑GPS跟踪數據(經度和緯度),時間戳,和運行狀態(無論乘客的存在或不存在)的形式輸入。鼓勵其最佳的正常運行時間和利益,回升點沿著連接路徑的列表。這種類型的系統是明顯地依賴於的地方,並且它是手持設備和嵌入式設備必須運行作為計算和低能量的要求保持。

Netflix的[編輯]獎項

獎通電Netflix的推薦系統是一個關鍵的事件。 2006-2009年,超過10%,從現有的推薦系統提供準確的是Netflix的數據集,並返回超過1億元的電影評級的一個團隊,可以採取100億美元的目標提供建議,先後贊助了競爭,並提供比賽通電尋找新的和更精確的算法。九月21,2009 BellKor隊在混沌的主人,為1,000,000美元的目標已給出。

使用集成方法的法律,將107個不同的算法來預測最準確的算法[19]:2007

測子幾個予混合時,預測精度大大提高。根據我們的經驗,大部分的努力是相當不同的方法來推導出一個複雜的技術和幾乎要集中。其結果是,我們的解決方案是一種合奏幾個

預計第二次比賽,但最後還是在正在進行的訴訟與美國聯邦貿易委員會的關注已被取消。 [20]

[編輯]隱私問題

的用戶簡檔,使用協同過濾的建設從個人的角度來看,可以是一個問題。在歐洲的許多國家中,介紹了各級用戶配置文件具有濃厚的文化氣息的數據隱私,而且任何嘗試可能會導致客戶負面反應。

環顧Netflix的獎競爭為Netflix提供的​​數據集,個人意志的問題。匿名數據,在2007年,為了保護您的隱私,我們的客戶,但在互聯網電影數據庫在得克薩斯大學的​​兩位研究人員,這部電影的評價和數據集,通過比較,可以識別個人用戶。 [21] 2009年12月的Netflix的匿名用戶身份不明的與Netflix和Netflix的數據將公佈的美國公平貿易的法律和視頻違反了隱私法要求從Netflix公司,已經提起了訴訟。 2010年的現象[22],這在一定程度導致了第二Netflix的取消。 [20]

許多研究領域的不斷提高個人的問題是正在進行中。拉瑪奎師那。弱的個性化和個人連接之間的權衡關係和全面的介紹提供了一個建議的巧合(意外),可以用來顯示用戶從其他數據源的身份,匿名數據集被發現[23]
2012-10-28 07:18 PM#1
查看資料  Blog  發短消息  頂部
       

  可打印版本 | 推薦給朋友 | 訂閱主題 | 收藏主題  


論壇跳轉:  
Vens婚紗攝影 - EasyBiz商務中心 - IGO藍牙耳機 - 潛水樂園村 - Royal皇族健身中心 - 任逍遙 - Screensavers and multimedia authoring tools - 歌唱英語 - 雙鴨山市道路運輸管理處 - 中國深圳國際投資貿易項目洽談網 - 昌都洛隆縣政府網站
會員登陸 論壇資料 最新發表主題 最新回覆主題

[立即註冊]
密      碼 :    [忘記密碼]
安全提問 :   
回      答 :   

IP : 54.82.13.49
來自 : 
瀏 覽 器:
操作系統: -->
您上次訪問是在: 2016-9-24 09:54 AM
現在時間是: 09:54 AM
RSS面面觀 » 推薦系統 » 基於內容的過濾已運行3831
今日發表: 篇
主題總數: 篇
帖子總數:0 篇
會員總數:1 人
線上用戶: 人在線
歡迎新會員:admin
搜索論壇

高級搜索
半導體器件中的應用
半導體設備
光電隔離器
技術
迅雷(接口)
氣象
紅外線
禁帶
電子產品
光電二極管
網狀光網絡
遷移
相移鍵控
暗光纖
碼分多址
DWDM系統
WDM系統
安東尼奧·梅烏奇死亡
破產
安東尼奧·梅烏奇
超有機體
社交商務
智能手機
基於內容的過濾
概述
不準確的源
市場預測
過程
公開來源情報
成就
開放式空間技術
智域
應用
MIM上的演變的影響
傳輸
米姆
知識生態系統
跟上攀比
原稿紙張
一百猴子效果

友情鏈接:

- 2009年東亞運動會
- 2009年東亞運動會結果
- facts and figures
- Agent
- Aptadigital SRL
- festival de cannes 
- Global Credibility in Credentials Evaluation
- ebn-cbc.net
- Ganciaone
- 亚洲材料会议暨展览
- kapaldodesign
- 瀘州老酒壇
- National Council for Accreditation of Teacher Education
- mike kelly
- phone one
- Pros Logion Conjecture 001
- sustainable energy technologies
- nsk轴承
- Toy Story
- 叱吒903
- Webture Sdn. Bhd.
- mp3 downloads
- 紅十字會流動通訊查詢




Processed in 0.006923 second(s), 11 queries
所有時間為 GMT+8, 現在時間是 2016-9-25 09:54 AM 清除 Cookies - 聯繫我們 - RSS面面觀 - Archiver - WAP