3億站點(diǎn)被打擊,百度開(kāi)出“救命藥”——最新網(wǎng)站數(shù)據(jù)生產(chǎn)指南!
前幾天,全網(wǎng)的站點(diǎn)基本99%都在降權(quán) 、降詞,用百度官方的話說(shuō),不展現(xiàn)、不召回、不索引,在百度一陣痛打后,百度又給咱們的站長(zhǎng)送上了“救命藥”——網(wǎng)站數(shù)據(jù)生產(chǎn)指南,鼓勵(lì)你如何正確生產(chǎn)優(yōu)質(zhì)資源數(shù)據(jù)。
以下內(nèi)容從2??個(gè)方面去講解:
一、抓取到展現(xiàn)中間發(fā)生了什么?
二、數(shù)據(jù)生產(chǎn)建議
一、抓取到展現(xiàn)中間發(fā)生了什么?
抓取到展現(xiàn)其實(shí)是個(gè)復(fù)雜的篩選過(guò)程,從網(wǎng)站——鏈接——網(wǎng)頁(yè)——索引——搜索,這其中也有鏈接篩選、網(wǎng)頁(yè)篩選、索引篩選,剛好我最近看了關(guān)于搜索召回的內(nèi)容,這里就簡(jiǎn)單舉個(gè)例子,用戶(hù)a搜索一個(gè)關(guān)鍵詞“seo怎么做?”,那么備選資源有1000條,搜索引擎通過(guò)多路召回、比如相似度搜索召回等,取出500條進(jìn)行粗排、細(xì)排等,這其中會(huì)涉及到向量嵌入、tf-idf等,感興趣的大伙可以自己找資料學(xué)習(xí)下,別總是網(wǎng)站被打擊了,還整天只會(huì)吹水。
二、數(shù)據(jù)生產(chǎn)建議
數(shù)據(jù)生產(chǎn)誤區(qū)
1、鏈接越多越好
2、內(nèi)容/關(guān)鍵詞越多越好
3、倒流越多越好
4、收錄不維護(hù)
其中這4條很好理解,我總結(jié)一下,一個(gè)站點(diǎn)并不是頁(yè)面越多越好,只要做到精而美就夠了,另外用一些作弊手法進(jìn)行導(dǎo)流,尤其是被懲罰的站點(diǎn)導(dǎo)流也是不允許的。
生產(chǎn)資源建議
鏈接生產(chǎn)方面:
1、首頁(yè)鏈接
建議官網(wǎng)認(rèn)證,并且網(wǎng)站內(nèi)容完善后才上線為佳。
2、站內(nèi)鏈接
避免動(dòng)態(tài)帶變化參數(shù)無(wú)效鏈接,比如url=?&1214.html等,避免自動(dòng)化批量生產(chǎn)內(nèi)容,換句話說(shuō),用ai生產(chǎn)低質(zhì)內(nèi)容無(wú)效了,尤其是偽原創(chuàng)、同義詞替換等。
3、主域內(nèi)規(guī)范建站
避免主域名下站點(diǎn)泛濫,比如頂級(jí)域名做娛樂(lè)等,二級(jí)域名又做其他類(lèi)型的站。
4、合理使用站平入口
關(guān)于資源提交,優(yōu)先使用api提交工具。(文章附帶api自動(dòng)提交工具,適合所有類(lèi)型的站)
內(nèi)容生產(chǎn)
1、首頁(yè)
網(wǎng)站tdk符合seo規(guī)范,內(nèi)容美觀、精美
2、內(nèi)容建議
聚焦生態(tài)類(lèi)型,精而優(yōu),內(nèi)容邏輯清晰、段落層次分明、用戶(hù)閱讀體驗(yàn)好,同時(shí)注重排版、豐富度以及頁(yè)面整體質(zhì)量。
3、內(nèi)容應(yīng)避免
tdk避免堆砌,不使用采集、避免拼湊、重復(fù)內(nèi)容,另外,同一服務(wù)器下或不同服務(wù)器不同模版相同內(nèi)容站點(diǎn),可以歇菜了。之前一些站長(zhǎng)關(guān)心的相同模版、不同內(nèi)容應(yīng)該沒(méi)事,但不同模版、相同模版就有問(wèn)題了,站長(zhǎng)們要多注意一下。
4、保障頁(yè)面功能、避免消費(fèi)障礙
網(wǎng)站自帶功能如查詢(xún)、播放、購(gòu)買(mǎi)、下載等交互功能,保證基礎(chǔ)用戶(hù)體驗(yàn)。
資源導(dǎo)流
違規(guī)的導(dǎo)流會(huì)傳遞負(fù)向特征,如果跟無(wú)關(guān)、無(wú)價(jià)值頁(yè)面,會(huì)因?yàn)閷?dǎo)流關(guān)系受到打壓,如關(guān)聯(lián)站點(diǎn)降級(jí)等,比如a網(wǎng)站被整體降權(quán),站長(zhǎng)想用b網(wǎng)站救活a網(wǎng)站,采取了b站301到a站,或b站掛a站廣告、鏈接等,都會(huì)受到牽連。
注意事項(xiàng)
我們?cè)谧稣军c(diǎn)都時(shí)候,注意配置好301/302,以及https的友好型,另外避免使用第三方?jīng)]有質(zhì)量保障的cdn服務(wù)商,如果有開(kāi)發(fā)能力的話,建議開(kāi)通小程序,wise/pc端做好適配,robots規(guī)范書(shū)寫(xiě),最后就是定期安檢,避免被黑,強(qiáng)烈建議生產(chǎn)長(zhǎng)尾資源,依據(jù)長(zhǎng)尾關(guān)鍵詞去生產(chǎn)數(shù)據(jù),至于具體怎么做,詳細(xì)參考我的另外一篇文章。
每次百度直播課,只要是工程師一出面,基本上都是干貨滿(mǎn)滿(mǎn),總結(jié)這次百度出的網(wǎng)站數(shù)據(jù)生產(chǎn)指南,其實(shí)也是在為以后站長(zhǎng)指明了一條路,那就是,好好做優(yōu)質(zhì)內(nèi)容,別整天想著走捷徑,不然就跟今天一樣,站被拔毛了都沒(méi)人心疼一下。
最后,結(jié)合站長(zhǎng)常見(jiàn)的問(wèn)題,整理了一些答案,請(qǐng)各位站長(zhǎng)對(duì)照:
q:原創(chuàng)內(nèi)容收錄了,過(guò)幾天又不見(jiàn)了?
a:資源有進(jìn)場(chǎng) 也就有退場(chǎng),內(nèi)容一般因?yàn)闀r(shí)效性問(wèn)題以及內(nèi)容質(zhì)量下降導(dǎo)致,個(gè)人建議這種情況在原來(lái)內(nèi)容上改一下,然后提交,如果可以,也可以刪除。
q:很多站長(zhǎng)質(zhì)疑每次在站長(zhǎng)資源平臺(tái)上得到的反饋都是機(jī)器人回復(fù),要么就是丟個(gè)白皮書(shū)鏈接,這樣有用嗎?
a:白皮書(shū)內(nèi)容是產(chǎn)品、運(yùn)營(yíng)辛苦總結(jié)的經(jīng)驗(yàn),看白皮書(shū)不是說(shuō)只看表面,要理解的去看。
q:最近收錄異常到底怎么回事?
a:收錄存在一定周期才能識(shí)別,具體還要看索引和流量情況,如果有異??商峤环答仭N覀€(gè)人的看法就是,百度官方最近更新導(dǎo)致搜索結(jié)果異常,當(dāng)然這些異常官方肯定不認(rèn)的。
q:采集內(nèi)容怎么處理?