如何看待文章采集這個事的?站長對采集的態(tài)度,決定了網(wǎng)站發(fā)展
在seo這個行業(yè),采集不認為是可恥的事情,尤其對站長這種雙標的“職業(yè)”來說,別人都是菜鳥,自己才是大神這一套理論跟一邊勸說別人不要采集,轉(zhuǎn)頭自己采集的比誰都歡這種做法如出一轍,所以,不要有心理負擔,開著采集器就行了。
一、為什么一定要采集?
我簡單地理解為,人的趨利和懶惰這兩個方面,你看過不少大站,權(quán)重可以達到6-7.然后你再看人家的文章id,已經(jīng)排序到幾百萬的數(shù)據(jù)量了,按照一個正常編輯的工作量,就算一天10篇原創(chuàng)內(nèi)容,從不休息,一年也只能生產(chǎn)3650篇文章,如果達到一百萬的內(nèi)容量,換句話說,你要花費274年,也就是說,一個正常的、又會寫的,要從清朝乾隆十二年開始到現(xiàn)在,才能完成如此大的工作量,所以,人工生產(chǎn)海量的內(nèi)容,完全不現(xiàn)實。你也許就能理解為什么現(xiàn)在那么多人喜歡采集,完全是為了不想禍害自己的下4代人。
從另外一個角度來講,如果說一篇文章能給你帶來1個訪客,那么你肯定就想越多越好,所以就造就了這個局面,一切多多益善。
二、為什么你采集起不來?
了解上面的采集借口,或許你更關(guān)心這樣一個問題,為什么人家的采集起來了,我的就起不來,原因有這幾個方面:
1、域名
2、頁面質(zhì)量
很多實驗表明,一個站點評級不行,你采集的內(nèi)容也不會收錄排名,換句話說,你的采集起不來,多半是這些原因的,另外還值得說明的是,采集的內(nèi)容不一定是垃圾內(nèi)容,百度白皮書說的采集,只是針對垃圾內(nèi)容采集懲罰,從這點來看,百度對采集的態(tài)度是很曖昧的。
如果說你的采集內(nèi)容起不來,建議走優(yōu)質(zhì)內(nèi)容路線,先把評級養(yǎng)起來再做采集內(nèi)容處理,我的經(jīng)驗是多做增益頁面內(nèi)容,頁面加隨機url。
三、主流采集方法
目前主流采集方法有以下兩種;
1、純采集
使用采集軟件某魚、某數(shù)、某俠、某頭、某鐵等,直接寫規(guī)則直接開采,一天下來可以達到上萬篇,什么都不用動,開個定時任務(wù)就好。
2、組合采集
這類采集組合是采集過來的內(nèi)容進行處理,標題加上長尾詞,內(nèi)容出現(xiàn)自定義段落。
四、采集如何應對?
如果你是采集的一方,那肯定爽歪歪的,從274年能縮短到不到1年都能完成工作量,你要感謝現(xiàn)在的科技,但如果你是被采集的一方,我知道你想死的心都有了,這里建議幾個方法:
1、代碼增加禁止f12,禁止右鍵復制。
2、采集的規(guī)則基本都是取唯一性,所以多加混淆ID,讓采集規(guī)則失效。
3、和律師事務(wù)所或律師合作,做好法律申明,然后你懂的。
最后,雖然說采集可以減少工作量,但是仍然不建議去做純采集的工作,因為不少大站雖然說數(shù)量起來了,但是收錄率,詞庫很低,但有的優(yōu)質(zhì)站點,收錄才1w,但權(quán)重和詞庫出詞效果很好,所以,你應該明白了一些門道。