百度鼓勵原創,您準備好了嗎?

Tags: 網站, 內容, 原創,

網際網路鼓勵原創,尤其是對於搜尋引擎,更希望將優質的原創內容推薦給使用者,16號的時候,百度站長平臺lee發表了一篇名為:談談原創專案那點事。其主要目的,就是鼓勵所有的站長支援原創。那麼,百度是如何判斷網站內容是原創的呢?Q豬就這篇文章,說一下,自己的看法,歡迎拍磚。

重視原創的目的:

1、採集氾濫

分析:網際網路上,採集氾濫的地區主要分佈在,新聞、諮詢、小說等領域,由於現在採集器越來越複雜,一般一個網站是很難防止不被採集的。

做網站做內容,我們經常會發現的一個問題,就是,自己在網站上,原創更新了一篇內容,但是過幾天去百度查詢排名的時候,會發現,由於網站權重等因素,那些轉載了該篇文章的網站,卻排在了前列。

對於大多數的中小型網站來說,搜尋流量在總流量中,佔有很重要的位置,如果長期原創,卻不能獲得應有的排名和流量,站長就會失去原創的興趣,從而減少原創的比例。

2、提高使用者體驗

分析:大家都知道,原創文章對於網站的重要性,但是創造原創內容是一件很困難、很費時間的事情,有市場就會機會,所以市場了出現了大量的偽原創工具,原理就是將文章章節打亂,通過重新組合、新增關鍵詞等方式,努力將原來的文章變成一篇新的。

這些文章有一個共同點就是,可讀性較差,從而導致使用者體驗度不高,另一方面,對搜尋引擎的搜尋質量也會產生一定的影響。

提高使用者體驗,這是一個永遠的話題,對於搜尋引擎來說,雖然現在很多方面都做的還不夠盡如人意,但是至少一直是在朝這個方向努力。Q豬建議,對於站長來說,只有增加網站原創內容,提高使用者體驗,網站才能長久的發展下去。

3、鼓勵原創作者和原創內容

分析:就像第一點說的那樣,只有對堅持原創的網站、原創的內容,給予適當的權重、排名,只有原創作者享受到了,原創所帶來的巨大利益,作者才會堅持原創下去。

判斷原創內容有哪些困難:

1、冒充原創,篡改關鍵資訊

分析:其實很多堅持原創的網站,都是那些中小型網站,但是由於蜘蛛爬行頻率、搜尋引擎重視程度等原因,在原創文章發表以後,經過其他網站的轉載,篡改文章中涉及到的版權、關鍵詞等資訊,冒充原創。

由於轉載網站在權重等方面的優勢,搜尋引擎蜘蛛很難去判斷,這篇文章是哪一個網站抄襲了哪一個網站。

2、使用偽原創工具,對文章改頭換面,批量生產“原創文章”。

分析:不管如何判斷文章是否為原創,由於網路上數以億計的海量文章,判斷的主體,都是程式來檢驗的。是程式就會有漏洞,是程式就可以摸索其中的規律,很多偽原創工具,可以通過這些工具和漏洞,將文章重新組合以後,變成“原創”。

由於製造原創的工具也是隨著演算法的變化而變化的,在判斷過程中,也會擁有一定的難度。

從百度的描述中,可以看到,由於通過工具生產的所謂“原創文章”,具有語句不通順,使用者可讀性差等原因,這些內容,是這段時間,百度重點整治的物件。Q豬提醒,如果你也在使用這些工具,就趕緊停止吧。

3、結構差異化

分析:我們知道,每個網站的結構都具有差異化,搜尋引擎在抓取內容時,一般是通過分析,同一個網站中,哪些內容是通用的、哪些內容是真正具有價值的,然後分析這些有價值的內容,再索引至資料庫中。

但是,不同的站點結構化差異比較大,html標籤的含義和分佈也不同,因此提取關鍵資訊如標題、作者和時間的難易程度差別也比較大。所以,每個網站都需要一個合理的網站結構,簡單、清晰、明確,不僅讓搜尋引擎可以很清楚的抓取網站內容,也可以讓使用者更流暢的瀏覽網站內容。

關於如何建立一個合理的網站結構,可以看一下,Q豬的另一篇文章:如何製作合理的網站結構

百度為鼓勵原創,所採取的措施:

1、單獨成立原創專案組

分析:按照百度的說法,這個部門將長期成立,為如何判斷原創,提供技術、產品、運營、法務等各方面支援。

2、 原創識別“起源”演算法

百度如何判斷原創內容,這個才是重點。

a.首先通過內容的相似程度,將網路上,所有主題相似、內容相近的文章,不管原創或者採集,都聚合在一起。

b.然後通過作者、釋出時間、連結指向、使用者評論、作者和站點的歷史原創情況、轉發軌跡等因素,綜合考慮,判斷原創內容。

c.最後通過價值分析系統,判斷該原創內容的價值高低,進而適當的指導最終排名順序。

3、原創星火計劃

分析:這個計劃需要百度和站長共同努力來維護網際網路的生態環境,站長推薦原創內容,搜尋引擎通過一定的判斷後優待原創內容,共同推進生態的改善,鼓勵原創,這就是“原創星火計劃”,旨在快速解決當前面臨的嚴重問題。

簡單來說,就是站長推薦原創內容,然後百度再通過演算法、甚至人工來判斷是否為原創,這是一個改進演算法的過程,也是一個較快實現原創內容被髮掘的過程。

綜合上面的觀點,要獲得百度鼓勵原創政策的照顧,作為站長首先需要做到的就是,網站內部做好結構優化、堅持原創制作、鼓勵使用者評論、保證網站內部連結的暢通,如果可以,保留每篇文章釋出的時間。

當然還有最重要的一定,就是如果文字是轉載的,請保留原創的連結指向,這將有助於本身網站的原創判斷。

相關問題答案