百度站長平臺后臺有個索引量,如果你的索引量為10,但用site命令會發(fā)現(xiàn)網(wǎng)站只收錄了6頁,這就表示剩下4頁索引還需要時間審查,至于什么時候放出來,需要綜合考量,比如頁面內(nèi)容質(zhì)量,網(wǎng)站速度,重復(fù)內(nèi)容等等。
簡單來說,就是有索引只是代表網(wǎng)頁鏈接被百度數(shù)據(jù)庫接收了,但是不一定會被正式收錄,如果提交的頁面鏈接不符合標(biāo)準(zhǔn),索引會減少,但是一旦索引量穩(wěn)定了,就早晚會放出來收錄,只是時間問題。
新站往往會有一個考察期,建議新站上線后使用百度站長平臺的新站保護(hù)功能(站點屬性),可以加快收錄,注意只有國內(nèi)的服務(wù)器才能享受到這個福利,不能填寫備案號的網(wǎng)站沒有資格,哭~~~~
百度搜索資源平臺提交鏈接分四大方式:主動推送、自動推送、sitemap、手動推送。
最為快速的提交方式,百度的主動推送是為了讓大家推送最新產(chǎn)生的網(wǎng)頁,而不是不斷提交相同的舊網(wǎng)頁,這樣可以縮短百度爬蟲發(fā)現(xiàn)你站點新鏈接的時間,使新發(fā)布的頁面可以在第一時間被百度索引,但索引不代表收錄放出網(wǎng)頁了。
一般推送以后的內(nèi)容1-5天才會出現(xiàn)在快照中。如果你的網(wǎng)站質(zhì)量較高,或者你的網(wǎng)站屬于新聞資源類型的網(wǎng)站,一般主動推送后內(nèi)容是可以立刻就出現(xiàn)在搜索引擎結(jié)果中的。郁悶的是我發(fā)現(xiàn)一些采集新聞的新站居然排名可以比老站高,這個就不知道后期會不會進(jìn)入沙盒了。
主動推送支持多種途徑:比如curl 、post、php以及ruby等。而且支持一次性提交多條網(wǎng)站頁面地址,不過每個站點每天可推送的次數(shù)有限制。wordpress網(wǎng)站一般使用PHP方式推送(制作一個PHP文件放入根目錄)。
百度官方認(rèn)為:主動推送是最為快速的提交方式,只要你一更新文章,站點就會將當(dāng)天新產(chǎn)出鏈接立即通過此方式推送給百度,以保證新鏈接可以及時被百度收錄。
自動推送是在網(wǎng)站安裝百度自動推送JS代碼(JS代表是所有程序都兼容的)。
當(dāng)你每次發(fā)布文章后,只要第一時間訪問一下文章頁面,即可在前臺觸發(fā)推送機制,將最新文章推送給百度頁面URL將立即被推送給百度。
雖然百度說支持主動推送和自動推送代碼配合使用,二者互不影響。但我保持懷疑,因為有重復(fù)提交的問題,基本選擇一種就可以了。
Sitemap是將網(wǎng)站的要提交給百度所有鏈接集合起來,就是制作一個Sitemap文件,然后將Sitemap提交給百度。百度會每周抓取檢查你提交的Sitemap,對其中的鏈接進(jìn)行處理,但收錄速度慢于主動推送。
比如你的文章寫完了,漏了主動推送,雖然做了自動推送,但是某一篇文章卻沒有被訪問到,就不能及時地被百度抓取了。如果想要無遺漏的快速被百度抓取,sitemap就起到作用了。
百度Sitemap協(xié)議支持三種格式:文本格式、xml格式、Sitemap索引格式,可以根據(jù)自己情況來選擇任意一種格式組織sitemap.
對鏈接提交有問題的網(wǎng)頁,可以使用百度站長平臺的抓取診斷工具進(jìn)行排查,看看到底哪里出了問題。
注意:這些推送的內(nèi)容僅僅是進(jìn)入了百度搜索的數(shù)據(jù)庫中,是否會在搜索結(jié)果中顯示還需要百度爬蟲的進(jìn)一步檢測和處理。
以上4種方法,雖然百度是提倡多種鏈接推送同時使用,互為補充,意思是如果我們用不同的方式同時推送了一條鏈接,百度可以給你去重后顯示。
但實際我嘗試的時候,發(fā)現(xiàn)每次同時提交完,第二天就掉收錄了,同一篇文章,重復(fù)多次推送,可能會讓百度蜘蛛誤認(rèn)為你的這篇文章更新頻繁,文章不穩(wěn)定等而進(jìn)入收錄沙盒期,造成短時間內(nèi)得不到展示。而且經(jīng)常重復(fù)提交頁面舊鏈接,鏈接配額將會下調(diào),并可能失去主動推送功能的權(quán)限。
熊掌號里有一個天級收錄,一般給每個站點的配額是有限制的,每天10條。
如果網(wǎng)站中有哪些鏈接還未被百度收錄,可以通過天極收錄提交給百度,前一天提交的鏈接,一般第二天就被百度收錄了,但有時候狂跌,可能跟重復(fù)提交有關(guān)系。
網(wǎng)站收錄禁忌
網(wǎng)站速度慢、不穩(wěn)定,經(jīng)常出現(xiàn)無法打不開或連通異常的狀況。需要使用穩(wěn)定的服務(wù)器。
新站上線短期內(nèi),只新增更新內(nèi)容就行了,不要去改動以前的內(nèi)容,特別是標(biāo)題,搜索引擎對標(biāo)題很敏感,以免延長新站考核時間,并不給收錄,當(dāng)網(wǎng)站索引趨于穩(wěn)定狀態(tài)后可以適當(dāng)改動
robots文件不要禁止太多項目,不要禁止收錄圖片,注意要加入制作網(wǎng)站站點地圖Sitemap.xml,這樣可以加快收錄。
搜索引擎對收錄沒有文字的圖片和視頻有短板,搜索瀏覽器搜索到的是你首頁的標(biāo)題,接著才通過你的導(dǎo)航系統(tǒng)搜索到你網(wǎng)站的其他內(nèi)頁,如果圖片、視頻則不能達(dá)到這個效果。
網(wǎng)站內(nèi)容不要出現(xiàn)重復(fù),同樣的話題不要多次編輯,網(wǎng)站頁面不要留空頁,不要大量采集和復(fù)制別人的內(nèi)容,盡量保持原創(chuàng),形成良性循環(huán)。加強網(wǎng)站內(nèi)鏈建設(shè),多發(fā)高質(zhì)量文章。
利用友情鏈接或者錨文本鏈接來引蜘蛛,防止網(wǎng)站成為孤島頁面。
沒有外鏈會延長爬蟲爬取網(wǎng)站并收錄的時間,所以要弄些高質(zhì)量的外鏈來來加速網(wǎng)站收錄。(順道說一句,知乎的外鏈已經(jīng)不被收錄了,只適合引流推廣)
注意:不要搞亂七八糟與網(wǎng)站無關(guān)的外鏈,外鏈在精不在多,優(yōu)質(zhì)的外鏈不僅能引流,還能促進(jìn)蜘蛛爬取。短時間內(nèi)如果網(wǎng)站產(chǎn)生大量垃圾外部鏈接,會觸發(fā)百度的“綠蘿算法”,延長網(wǎng)站考核期,甚至K站。
本文由今科科技用戶上傳并發(fā)布,今科科技僅提供信息發(fā)布平臺。文章代表作者個人觀點,不代表今科科技立場。未經(jīng)作者許可,不得轉(zhuǎn)載,有涉嫌抄襲的內(nèi)容,請通過 反饋中心 進(jìn)行舉報。
售前咨詢:0760-2332 0168
售后客服:400 830 7686
1998~2024,今科26年專注于企業(yè)信息化服務(wù)
立 即 注 冊 / 咨 詢
上 線 您 的 網(wǎng) 站 !