為了營造良好的搜索內容生態,保護搜索用戶的閱讀瀏覽體驗,保障優質內容生產方在百度搜索中的權益,百度將于9月下旬對颶風算法進行升級。請廣大站長盡快對照以下說明進行自查整改,清理全部違規采集內容。
颶風算法2.0主要打擊以下四類惡劣采集行為:
1.存在大量從其他站點或公眾號等內容生產方采集、搬運而來的內容,信息未經整合,排版混亂,文章可讀性差,有明顯采集痕跡,對用戶無任何增益價值。
示例1:
示例2:
2.存在多段文章拼接的內容,文章邏輯性差,無法滿足用戶需求,閱讀體驗差。
3.站點內存在大量采集內容,網站自身的內容生產力極差。
4.站點內存在大量與本站主題無關的采集內容,領域專注度差,惡意獲取流量。例如:科技網站采集大量娛樂八卦、社會新聞等情況。
颶風算法主要包含以下四類惡劣采集行為:
類型1:采集痕跡明顯
詳細說明:站點存在大量從其他站點或公眾號采集、搬運而來的內容,信息未經整合,排版混亂,部分功能缺失或文章可讀性差,有明顯采集痕跡,用戶閱讀感受很差。
示例:采集文章內容中存在超鏈接不可點、功能缺失問題,采集痕跡明顯
建議:對于網站發布的內容,需注意文章的排版和布局,不應出現與文章主旨不相關的信息或不可用的功能,干擾用戶的瀏覽。
類型2:內容拼接
詳細說明:采集多篇不同文章進行拼接,整體內容未形成完整邏輯,存在閱讀不通順、文章不連貫等問題,無法滿足用戶需求。
示例:前后內容無關,邏輯不連貫
建議:我們嚴厲反對利用采集編輯器等工具,隨意生產拼接采集內容的行為,請網站多多生產對用戶有價值的原創內容。
類型3:站點存在大量采集內容
詳細說明:網站內容下多數內容均為采集,網站自身無內容生產力或內容生產能力較差,網站內容質量較低。
建議:我們鼓勵站點生產原創內容,如若轉載需標明出處。(如:新聞、政策類等標明出處的轉載內容,不會被認為是采集內容)
類型4:跨領域采集
詳細說明:站點依靠采集大量與本站領域不一致的內容來獲取流量的行為。
示例:教育站點發布美食相關內容
建議:我們鼓勵站點生產領域內的文章和內容,通過領域專注度獲得更多的搜索青睞。不要嘗試采集跨領域的內容來獲得短期收益,這樣會造成領域專注度的降低,從而影響站點在搜索中的表現。
綜上,颶風算法2.0旨在保障搜索用戶的瀏覽體驗,保護搜索生態的健康發展、對于違規網站,百度搜索會依據問題的惡劣程度有相應的限制搜索展現的處理。
對于第一次違規的站點,改好后解除限制展現的周期為1個月;
對于第二次違規的站點,我們將不予釋放。