百度原創怎麼理解?

一直以來,度娘提倡原創,而站長們都懂的,有用奶盤工具,偽原創工作做偽原創的,替換下內容後又成一個原創了,還有一些蛋疼的孩子用翻譯,先翻譯成英文,然後再拿英文翻譯成中文,尼媒,也在一個原創了,當然也有好的孩子是自己手寫原創,還有一些是買本最新的書,每天都在那裡打字的(這一類最佩服了。。。真有毅力),接下來我們看一下度娘對原創的看法吧,下面內容是摘自百度的站長學院,內容如下:談談原創專案那點事 一、搜尋引擎為什麼要重視原創1.1 採集氾濫化來自百度的一項調查顯示,超過80%的新聞和資訊等都在被人工轉載或機器採集,從傳統媒體的報紙到娛樂網站花邊訊息、從遊戲攻略到產品評測,甚至高校圖書館發的催還通知都有站點在做機器採集。可以說,優質原創內容是被包圍在採集的汪洋大海中之一粟,搜尋引擎在海中淘粟,是既艱難又具有挑戰性的事情。1.2 提高搜尋使用者體驗數字化降低了傳播成本,工具化降低了採集成本,機器採集行為混淆內容來源降低內容質量。採集過程中,出於無意或有意,導致採集網頁內容殘缺不全,格式錯亂或附加垃圾等問題層出不窮,這已經嚴重影響了搜尋結果的質量和使用者體驗。搜尋引擎重視原創的根本原因是為了提高使用者體驗,這裡講的原創為優質原創內容。1.3 鼓勵原創作者和文章轉載和採集,分流了優質原創站點的流量,不再具屬原創作者的名稱,會直接影響到優質原創站長和作者的收益。長期看會影響原創者的積極性,不利於創新,不利於新的優質內容產生。鼓勵優質原創,鼓勵創新,給予原創站點和作者合理的流量,從而促進網際網路內容的繁榮,理應是搜尋引擎的一個重要任務。二、採集很狡詐,識別原創很艱難2.1 採集冒充原創,篡改關鍵資訊當前,大量的網站批量採集原創內容後,用人工或機器的方法,篡改作者、釋出時間和來源等關鍵資訊,冒充原創。此類冒充原創是需要搜尋引擎識別出來予以適當調整的。2.2 內容生成器,製造偽原創利用自動文章生成器等工具,“獨創”一篇文章,然後安一個吸引眼球的title,現在的成本也低得很,而且一定具有獨創性。然而,原創是要具有社會共識價值的,而不是胡亂製造一篇根本不通的垃圾就能算做有價值的優質原創內容。內容雖然獨te,但是不具社會共識價值,此類偽原創是搜尋引擎需要重點識別出來並予以打擊的。2.3 網頁差異化,結構化資訊提取困難不同的站點結構化差異比較大,html標籤的含義和分佈也不同,因此提取關鍵資訊如標題、作者和時間的難易程度差別也比較大。做到既提得全,又提得準,還要最及時,在當前的中文網際網路規模下實屬不易,這部分將需要搜尋引擎與站長配合好才會更順暢的執行,站長們如果用更清晰的結構告知搜尋引擎網頁的佈局,將使搜尋引擎高效地提取原創相關的資訊。三、百度識別原創之路如何走?3.1 成立原創專案組,打持久戰面對挑戰,為了提高搜尋引擎使用者體驗、為了使優質原創者原創網站得到應有的收益、為了推動中文網際網路的前進,我們抽調大量人員組成原創專案組:技術、產品、運營、法務等等,這不是臨時組織不是1個月2個月的專案,我們做好了打持久戰的準備。3.2 原創識別“起源”演算法網際網路動輒上百億、上千億的網頁,從中挖掘原創內容,可以說是大海撈針,千頭萬緒。我們的原創識別系統,在百度大資料的雲端計算平臺上開展,能夠快速實現對全部中文網際網路網頁的重複聚合和連結指向關係分析。首先,通過內容相似程度來聚合採集和原創,將相似網頁聚合在一起作為原創識別的候選集合;其次,對原創候選集合,通過作者、釋出時間、連結指向、使用者評論、作者和站點的歷史原創情況、轉發軌跡等上百種因素來識別判斷出原創網頁;最後,通過價值分析系統判斷該原創內容的價值高低進而適當的指導最終排序。目前,通過我們的實驗以及真實線上資料,“起源”演算法已經取得了一定的進展,在新聞、資訊等領域解決了絕大部分問題。當然,其他領域還有更多的原創問題等待“起源”去解決,我們堅定的走著。3.3 原創星火計劃我們一直致力於原創內容的識別和排序演算法調整,但在當前網際網路環境下,快速識別原創解決原創問題確實面臨著很大的挑戰,計算資料規模龐大,面對的採集方式層出不窮,不同站點的建站方式和模版差異巨大,內容提取複雜等等問題。這些因素都會影響原創演算法識別,甚至導致判斷出錯。這時候就需要百度和站長共同努力來維護網際網路的生態環境,站長推薦原創內容,搜尋引擎通過一定的判斷後優待原創內容,共同推進生態的改善,鼓勵原創,這就是“原創星火計劃”,旨在快速解決當前面臨的嚴重問題。另外,站長對原創內容的推薦,將應用於“起源”演算法,進而幫助百度發現演算法的不足,不斷改進,用更加智慧的識別演算法自動識別原創內容。目前,原創星火計劃也取得了初步的效果,一期對部分重點原創新聞站點的原創內容在百度搜索結果中給予了原創標記、作者展示等等,並且在排序及流量上也取得了合理的提升。

最後,原創是生態問題,需要長期的改善,我們將持續投入,與站長攜手推動網際網路生態的進步;原創是環境問題,需要大家來共同維護,站長們多做原創,多推薦原創,百度將持續努力改進排序演算法,鼓勵原創內容,為原創作者、原創站點提供合理的排序和流量。

PS:其實作為一個站長也很久了,對於原創這事還真不好說,有很多的SEO抱怨:尼媒,我自己辛辛苦苦的寫了個純原創,還沒被收錄,被大站一轉載,馬上就收錄了,而且過後排名還比自己高。。。好吧,這個度娘有點坑爹了,不過吧,這主要的原因就並不是原創不原創的問題了,主要是因為人家的使用者體驗比你好,也就是說人家可以讓更多的人看到這篇文章,所以使用者點選高,而你卻沒什麼流量,這是最主要的原因,解決辦法就是在原創寫出來後,多轉發幾個平臺,然後帶上源地址,這樣能有效的增加你的內容的質量,帶來更多的流量,同時也給更多的人去分享你的原創,讓更多的人知道這篇文章,這才是原創的目的吧,一篇高質量的內容往往能讓更多的人看到,更多的人受益,而我們建站不就是為了讓更多人看到我們,認可我們嗎?

相關問題答案