很多網(wǎng)站,尤其是商業(yè)網(wǎng)站,往往使用同一個模板,不同網(wǎng)頁的主體內(nèi)容高度相似或相同,僅一些 Title 等標(biāo)簽進(jìn)行了改變。比如一些招投標(biāo)網(wǎng)站,為了讓更多的地區(qū)得到投標(biāo)內(nèi)容,他們制作了大量頁面,標(biāo)題采用地區(qū) + 內(nèi)容的方式,而頁面的主體內(nèi)容都是完全相同的。對于百度搜索引擎來說,都屬于站內(nèi)大量重復(fù)內(nèi)容。
二、利用與站點(diǎn)無關(guān)的熱詞引流:
有些網(wǎng)站,尤其是新聞源站點(diǎn)緊盯百度的時效性熱詞,與自己網(wǎng)站文章的標(biāo)題進(jìn)行整合,其實(shí)就是我們常說的標(biāo)題黨,如"李娜退役隱情 體育明星豪宅全揭秘",用戶點(diǎn)擊后自然看不到關(guān)于李娜退役隱情的內(nèi)容。此種行為一經(jīng)發(fā)現(xiàn),網(wǎng)站會被取消新聞源資格,即使內(nèi)容真的是原創(chuàng),也會因此行為遭受牽連。
三、制作低質(zhì)靜態(tài)搜索結(jié)果頁或 TAG 標(biāo)簽頁:
很多網(wǎng)站都采用了將站內(nèi)搜索結(jié)果頁轉(zhuǎn)為靜態(tài)頁面的方式,整合站點(diǎn)資源,以期形成相關(guān)性得分高的頁面。但實(shí)際來看,很多站點(diǎn)通過站內(nèi)搜索或者 tag 生成的頁面相關(guān)性并不好,或者說產(chǎn)生了許多對百度搜索結(jié)果造成負(fù)面影響的頁面。如果整個目錄都存在這樣的現(xiàn)象,那么被懲罰的可能性就非常大了。如下方截圖,用戶搜 列車時刻表,這樣的頁面對他來說毫無價值。該頁面所在的目錄或站點(diǎn)做了很多類似內(nèi)容的頁面,且已經(jīng)對作用造成惡劣影響時,極容易受到搜索引擎的懲罰。
四、不負(fù)責(zé)任的采集:
首先需要澄清的是,百度說的拒絕采集,指的是大量復(fù)制互聯(lián)網(wǎng)上已有內(nèi)容,對采集的內(nèi)容不加整理即全部推至線上的 偷懶 行為。對于將采集來的內(nèi)容進(jìn)行再加工高效整合后,產(chǎn)出內(nèi)容豐富的高質(zhì)量網(wǎng)頁,百度沒有拒絕理由。所以,我們說,百度不喜歡不負(fù)責(zé)任的偷懶采集行為。
五、偽原創(chuàng):
上面我們說百度不喜歡不負(fù)責(zé)任的采集,于是有些人開始動起了偽裝原創(chuàng)的腦筋。采集內(nèi)容后對部分關(guān)鍵詞進(jìn)行批量修改,企圖讓百度認(rèn)為這些都是獨(dú)特內(nèi)容,然而內(nèi)容已經(jīng)是面目全非,甚至無法讀通——這也是百度不喜歡的,風(fēng)險很大。還是剛才說的觀點(diǎn),百度不排斥站點(diǎn)采集內(nèi)容,關(guān)鍵是如何應(yīng)用采集的內(nèi)容和數(shù)據(jù),如何整合成用戶和搜索引擎都需要的內(nèi)容才是站長應(yīng)該考慮的內(nèi)容。