推薦系統的意義?

General 更新 2024-11-25

推薦系統的概念及定義

定義:它是利用電子商務網站向客戶提供商品信息和建議,幫助用戶決定應該購買什麼產品,模擬銷售人員幫助客戶完成購買過程”。推薦系統有3個重要的模塊:用戶建模模塊、推薦對象建模模塊、推薦算法模塊。通用的推薦系統模型流程如圖。推薦系統把用戶模型中興趣需求信息和推薦對象模型中的特徵信息匹配,同時使用相應的推薦算法進行計算篩選,找到用戶可能感興趣的推薦對象,然後推薦給用戶。

推薦系統的背景簡介

互聯網的出現和普及給用戶帶來了大量的信息,滿足了用戶在信息時代對信息的需求,但隨著網絡的迅速發展而帶來的網上信息量的大幅增長,使得用戶在面對大量信息時無法從中獲得對自己真正有用的那部分信息,對信息的使用效率反而降低了,這就是所謂的信息超載(informationoverload)問題。解決信息超載問題一個非常有潛力的辦法是推薦系統 ,它是根據用戶的信息需求、興趣等,將用戶感興趣的信息、產品等推薦給用戶的個性化信息推薦系統。和搜索引擎相比推薦系統通過研究用戶的興趣偏好,進行個性化計算,由系統發現用戶的興趣點,從而引導用戶發現自己的信息需求。一個好的推薦系統不僅能為用戶提供個性化的服務,還能和用戶之間建立密切關係,讓用戶對推薦產生依賴。推薦系統現已廣泛應用於很多領域,其中最典型並具有良好的發展和應用前景的領域就是電子商務領域。同時學術界對推薦系統的研究熱度一直很高,逐步形成了一門獨立的學科。

如何評價一個推薦系統的性能好壞

我們把推薦當作是一個排名任務,這表示我們主要感興趣的是一個相對較少的項,我們認為這些項最相關並把它呈現給用戶。這就是眾所周知的Top-k推薦。

把它和評級預測做比較,如Netflix的競賽。2007年,Yehuda Koren(此次比賽的一個勝出者)指出,人們對使用RMSE作為一個指標並贊成使用RMSE指標存有疑惑,我們應該使用一個特定的排名指標。

然而,在我們有限的實驗中,我們發現RMSE指標並不適用於排名。對我們而言,當調整用戶留存率時,用於RMSE的矩陣分解優化表現的相當不錯,但當從所有的可用項選擇推薦時,卻徹底地失敗了。

我們認為原因是訓練會集中於評分較高的項,同時對於這些項產生一個很好的擬合結果。而對於評分較低的項,在損失影響方面沒有太大的意義。結果,對他們的預測會不平衡,使得與實際得分相比,一些得分較高,一些得分較低。最後,靠前的條目將顯示在熱門推薦一欄中,因而破壞了推薦結果。

換句話說,RMSE指標不能辨別真實的內情,而且我們需要特定的排名指標。

推薦系統的主要推薦方法

基於內容的推薦(Content-based Recommendation)是信息過濾技術的延續與發展,它是建立在項目的內容信息上作出推薦的,而不需要依據用戶對項目的評價意見,更多地需要用機 器學習的方法從關於內容的特徵描述的事例中得到用戶的興趣資料。在基於內容的推薦系統中,項目或對象是通過相關的特徵的屬性來定義,系統基於用戶評價對象 的特徵,學習用戶的興趣,考察用戶資料與待預測項目的相匹配程度。用戶的資料模型取決於所用學習方法,常用的有決策樹、神經網絡和基於向量的表示方法等。 基於內容的用戶資料是需要有用戶的歷史數據,用戶資料模型可能隨著用戶的偏好改變而發生變化。基於內容推薦方法的優點是:  1)不需要其它用戶的數據,沒有冷開始問題和稀疏問題。  2)能為具有特殊興趣愛好的用戶進行推薦。  3)能推薦新的或不是很流行的項目,沒有新項目問題。  4)通過列出推薦項目的內容特徵,可以解釋為什麼推薦那些項目。  5)已有比較好的技術,如關於分類學習方面的技術已相當成熟。缺點是要求內容能容易抽取成有意義的特徵,要求特徵內容有良好的結構性,並且用戶的口味必須能夠用內容特徵形式來表達,不能顯式地得到其它用戶的判斷情況。 協同過濾推薦 (Collaborative Filtering Recommendation)技術是推薦系統中應用最早和最為成功的技術之一。它一般採用最近鄰技術,利用用戶的歷史喜好信息計算用戶之間的距離,然後 利用目標用戶的最近鄰居用戶對商品評價的加權評價值來預測目標用戶對特定商品的喜好程度,系統從而根據這一喜好程度來對目標用戶進行推薦。協同過濾最大優 點是對推薦對象沒有特殊的要求,能處理非結構化的複雜對象,如音樂、電影。協同過濾是基於這樣的假設:為一用戶找到他真正感興趣的內容的好方法是首先找到與此用戶有相似興趣的其他用戶,然後將他們感興趣的內容推薦給此用 戶。其基本思想非常易於理解,在日常生活中,我們往往會利用好朋友的推薦來進行一些選擇。協同過濾正是把這一思想運用到電子商務推薦系統中來,基於其他用 戶對某一內容的評價來向目標用戶進行推薦。基於協同過濾的推薦系統可以說是從用戶的角度來進行相應推薦的,而且是自動的即用戶獲得的推薦是系統從購買模式或瀏覽行為等隱式獲得的,不需要用戶努力地找到適合自己興趣的推薦信息,如填寫一些調查表格等。和基於內容的過濾方法相比,協同過濾具有如下的優點:  1) 能夠過濾難以進行機器自動內容分析的信息,如藝術品,音樂等。  2) 共享其他人的經驗,避免了內容分析的不完全和不精確,並且能夠基於一些複雜的,難以表述的概念(如信息質量、個人品味)進行過濾。  3) 有推薦新信息的能力。可以發現內容上完全不相似的信息,用戶對推薦信息的內容事先是預料不到的。這也是協同過濾和基於內容的過濾一個較大的差別,基於內容的過濾推薦很多都是用戶本來就熟悉的內容,而協同過濾可以發現用戶潛在的但自己尚未發現的興趣偏好。  4) 能夠有效的使用其他相似用戶的反饋信息,較少用戶的反饋量,加快個性化學習的速度。雖然協同過濾作為一種典型的推薦技術有其相當的應用,但協同過濾仍有許多的問題需要解決。最典型的問題有稀疏問題(Sparsity)和可擴展問題(Scalability)。 基於關聯規則的推薦 (Association Rule-based Recommendation)是以關聯規則為基礎,把已購商品作為規則頭,規則體為推薦對象。關聯規則挖掘可以發現不同商品在銷售過程中的相關性,在零 售業中已經得到了成功的應用。管理規則就是在一個交易數據庫中統計......

《推薦系統實踐》 推薦解釋幫助我理解這部電影為什麼會被推薦

[核心提示] 讀項亮的《推薦系統實踐》後總結所得:算法雖然不能解決全部問題,但算法可以變得更人性化。網絡就是社會,其實算法和人之間早已不那麼涇渭分明瞭。   推薦系統這個東西其實在我們的生活中無處不在,比如我早上買包子的時候,老闆就經常問我要不要來杯豆漿,這就是一種簡單的推薦。隨著互聯網的發展,把線下的這種模式搬到線上成了大勢所趨,它大大擴展了推薦系統的應用:亞馬遜的商品推薦,Facebook的好友推薦,Digg的文章推薦,豆瓣的豆瓣猜,Last.fm和豆瓣FM的音樂推薦,Gmail裡的廣告......在如今互聯網信息過載的情況下,信息消費者想方便地找到自己感興趣的內容,信息生產者則想將自己的內容推送到最合適的目標用戶那兒。而推薦系統正是要充當這兩者的中介,一箭雙鵰解決這兩個難題。   推薦系統的評判標準   首先我們得明確什麼是好的推薦系統。可以通過如下幾個標準來判定。   用戶滿意度 描述用戶對推薦結果的滿意程度,這是推薦系統最重要的指標。一般通過對用戶進行問卷或者監測用戶線上行為數據獲得。   預測準確度 描述推薦系統預測用戶行為的能力。一般通過離線數據集上算法給出的推薦列表和用戶行為的重合率來計算。重合率越大則準確率越高。   覆蓋率 描述推薦系統對物品長尾的發掘能力。一般通過所有推薦物品佔總物品的比例和所有物品被推薦的概率分佈來計算。比例越大,概率分佈越均勻則覆蓋率越大。   多樣性 描述推薦系統中推薦結果能否覆蓋用戶不同的興趣領域。一般通過推薦列表中物品兩兩之間不相似性來計算,物品之間越不相似則多樣性越好。   新穎性 如果用戶沒有聽說過推薦列表中的大部分物品,則說明該推薦系統的新穎性較好。可以通過推薦結果的平均流行度和對用戶進行問卷來獲得。   驚喜度 如果推薦結果和用戶的歷史興趣不相似,但讓用戶很滿意,則可以說這是一個讓用戶驚喜的推薦。可以定性地通過推薦結果與用戶歷史興趣的相似度和用戶滿意度來衡量。   簡而言之,一個好的推薦系統就是在推薦準確的基礎上,給所有用戶推薦的物品儘量廣泛(挖掘長尾),給單個用戶推薦的物品儘量覆蓋多個類別,同時不要給用戶推薦太多熱門物品,最牛逼的則是能讓用戶看到推薦後有種「相見恨晚」的感覺。   推薦系統的分類   推薦系統是建立在大量有效數據之上的,背後的算法思想有很多種,要大體分類的話可以從處理的數據入手。   1.利用用戶行為數據   互聯網上的用戶行為千千萬萬,從簡單的網頁瀏覽到複雜的評價,下單......這其中蘊含了大量的用戶反饋信息,通過對這些行為的分析,我們便能推知用戶的興趣喜好。而這其中最基礎的就是「協同過濾算法」。   「協同過濾算法」也分兩種,基於用戶(UserCF)和基於物品(ItemCF)。所謂基於用戶,就是跟據用戶對物品的行為,找出興趣愛好相似的一些用戶,將其中一個用戶喜歡的東西推薦給另一個用戶。舉個例子,老張喜歡看的書有A,B,C,D;老王喜歡看的書有A,B,C,E。通過這些數據我們可以判斷老張和老王的口味略相似,於是給老張推薦E這本書,同時給老王推薦D這本書。對應的,基於物品就是先找出相似的物品。怎麼找呢?也是看用戶的喜好,如果同時喜歡兩個物品的人比較多的話,就可以認為這兩個物品相似。最後就只要給用戶推薦和他原有喜好類似的物品就成。舉例來說,我們發現喜歡看《從一到無窮大》的人大都喜歡看《什麼是數學》,那如果你剛津津有味地看完《從一到無窮大》,我們就可以立馬給你推薦《什麼是數學》。   至於什麼時候用Us......

如何評價一個好的推薦系統算法

我們把推薦當作是一個排名任務,這表示我們主要感興趣的是一個相對較少的項,我們認為這些項最相關並把它呈現給用戶。這就是眾所周知的Top-k推薦。

把它和評級預測做比較,如Netflix的競賽。2007年,Yehuda Koren(此次比賽的一個勝出者)指出,人們對使用RMSE作為一個指標並贊成使用RMSE指標存有疑惑,我們應該使用一個特定的排名指標。

然而,在我們有限的實驗中,我們發現RMSE指標並不適用於排名。對我們而言,當調整用戶留存率時,用於RMSE的矩陣分解優化表現的相當不錯,但當從所有的可用項選擇推薦時,卻徹底地失敗了。

我們認為原因是訓練會集中於評分較高的項,同時對於這些項產生一個很好的擬合結果。而對於評分較低的項,在損失影響方面沒有太大的意義。結果,對他們的預測會不平衡,使得與實際得分相比,一些得分較高,一些得分較低。最後,靠前的條目將顯示在熱門推薦一欄中,因而破壞了推薦結果。

換句話說,RMSE指標不能辨別真實的內情,而且我們需要特定的排名指標。

Ping++ 增長智能系統的「個性化推薦系統」能實現什麼功能?

智能訂貨系統可以打通人、貨、場三 數據,精準預測每個門店未來的商品需求種類和商品需求,降低商家的商品過期報廢率,增加利潤空間。

求推薦有關操作系統方面經典實用的書籍?

操作系統經典書籍推薦

.

Abraham Silberschatz的兩本書:

1. 實用操作系統概念(影印版)

2. 操作系統概念(第六版 影印版)

這個作者絕對是頂尖級的,來自貝爾實驗室,是目前世界上操作系統方面的領軍人物。這兩本書第二本和第一本很多地方相似,區別在於第二本理論偏重一些,第一本實例討論的更多一些。這兩本書別看很厚,但是寫的非常流暢,屬於比較易讀的一類。

3. 現代操作系統(英文版?第2版)

Andrew S. Tanenbuam(坦尼伯姆, AST)是第4本書的升級版,裡面添加了一些新的操作系統方面的討論,原理部分比第四本稍有增強。個人認為,是除了前面兩本之外的最好的書。

4. 操作系統: 設計及實現(第二版)(英文影印版)

這個比較有名了,主要是分析minix源代碼的書,順帶著講了下原理,應該說是偏於實踐的,可能當年的linus的教材就是這本,影響較大,可以幫助你瞭解一個文件系統或系統調用之類是如何實現的。當然,和目前的操作系統來講,稍簡單了一些。想做linux kernel hacker的同學此書可以一讀。

5. 操作系統:現代觀點(第二版 實驗更新版)(英文版)

Operating Systems: A design-Oriented Approach 這兩本一般,但是還是比國內抄襲的教材強很多,可以作為補充閱讀的書籍。

6. LINUX內核源代碼情景分析(上冊) LINUX內核源代碼情景分析(下冊)

Understanding Linux Kernel

Linux internal

這三本是最nb的linux內核分析書籍,後兩本講2.2內核,第一本講2.4。

7. 4.4BSD操作系統設計與實現(英文影印版)

不說少了,原來berkeley那幫寫bsd的其中幾個人寫的,經典就是它了。

8. UNIX操作系統設計(英文版)

:古老的unix設計方面的書籍,應該說這本書在unix世界裡面的影

響是十分巨大的,很多後來的unix分枝,思想都是緣於此書。裡面主要講解unix各個部分

實現時所用的算法,其中一些目前還在使用中。想了解一下unix實現但又沒什麼時間扣

minix或linux內核的朋友可以看看,在這本書上花費幾十個小時,絕對超值:)

9.Linux內核完全註釋

這一本書我覺得也很棒。它以Linux 0.11內核源碼為基礎進行詳細的分析,解釋細緻到位。雖然不是“經典”,但仍推薦!憑藉簡潔明瞭的源碼分析,你可以管窺Linux操作系統的奧祕。

*****************************

一名教師的建議:

想學操作系統的同學,推薦以下教材供選擇:

概念和理論:《現代操作系統》、《操作系統概念》

基於Unix:《Unix操作系統設計》

基於Linux:《深入理解Linux內核》

基於Windows:《深入解析Windows操作系統》

操作系統設計:《操作系統設計與實現》

源代碼分析:《Linux內核源代碼情景分析》

*********************************

如對解決你的問題有幫助.請及時點擊【採納為滿意回答】按鈕,順便點擊【給力】按鈕加好評更OK....

自定義創建方案和系統推薦方案什麼區別

請儘量找一個GB18030範圍字符的碼錶,因為這個工具只認GB18030的字符,如果碰到某一行含有超範圍的字符,它就會停止生成,該行以後定義的字詞 就都忽略掉了。而且android手機自帶的字體也只支持這麼大的範圍,GB18030之外的字符只顯示一個框框,加到手機輸入法中也沒有意義。

碼錶必須是ANSI編碼的。如果不清楚,請用記事本打開碼錶文件,點擊“另存為”

有什麼直銷系統推薦,求指教

直銷系統APP源碼,指的是技術工程師編寫的最原始程序的代碼。運行的直銷軟件APP是要經過編寫的,程序員編寫程序的過程中需要他們的“語言”。比如音樂家用五線譜,建築師用圖紙,那我們開發直銷系統APP的程序員的工作語言就是“直銷系統APP源碼”。  以前有很多人問過我,說直銷系統APP源碼可不可以給他,這時候我一般都會問,你要源碼幹什麼?這時候他們一般會跟我說很多,總結如下:  1、數據掌握在我自己的手上  當你自己掌握了這個源碼的時候,數據當然是掌握在你自己的手上。可是你想過沒有,任何的系統、任何的軟件都不可能是完美的,在使用的過程中都可能出現一些小問題、小漏洞,這些都需要技術工程師去修復,升級。我現在把源碼給你了,你的系統我就做不了維護了,因為不在我的數據庫運行。  2、我公司的技術可再次開發  其實這個點是絕大部分人的認識誤區,很多人認為有了直銷系統的源碼,就可以對系統進行再開發,加功能,複製。這些操作理論上是可以的,但是實際上可操作性為零。因為每間公司,每個技術的編寫習慣和方式都不同,如果你想再開發,你要熟悉以前的整個開發流程,這個過程在實際操作中是不可能完成的。  3、我公司的機密被你掌握了  說實話,做直銷系統APP開發的公司,任何的數據在他們眼裡都是代碼,沒有什麼特殊的意義。這些所謂的機密在運營者手中是機密,在我們手中只是一串串的代碼。開發和運營是兩個大方向,你見過多少公司在開發和運營都非常牛逼的,不太可能。專業的事情由專業的人來說,我一直相信這句話。  最後說一句,一般比較大的、正規的網絡公司都不會把源碼交給客戶,源碼都是一家網絡公司的心血,可以有價也可以無價!

相關問題答案
推薦系統的意義?
推廣漢服的意義?
系統的近義詞是什麼?
微博系統測試的意義?
推薦一些有意思的貼吧?
中華傳統美德的意義?
推廣全民閱讀的意義?
黨的統一戰線的意義?
系統的的近義詞?
秦始皇統一的意義知乎?