網站頻繁出現304狀态碼的原因
經常會碰到站長(cháng)們抱怨蜘蛛抓取返回碼老是304狀态,且抓取的次數越來越少的問題。搜索引擎為(wèi)了自身的用(yòng)戶體(tǐ)驗,會想盡辦(bàn)法來提高檢索調用(yòng)率、準确性、新(xīn)鮮度,這将導緻引擎不得不把主要的精(jīng)力放在擁有(yǒu)優質(zhì)内容源的網站上。惟其如此,搜索結果的質(zhì)量才能(néng)更加符合搜索者的體(tǐ)驗。
由此我們聯想到:搜索引擎爬蟲會更加青睐内容源更新(xīn)頻繁的網站。通過特定時間内對網站抓取返回的狀态碼來調節對該網站的抓取頻繁。若網站在一定時間内一直處于[304:沒有(yǒu)變化]的狀态,那麽引擎爬蟲可(kě)能(néng)會降低對網站的抓取次數。相反,若網站變化的頻率非常之快,每次抓取都能(néng)獲取新(xīn)版本,那麽日積月累,爬蟲的回訪率也會提高。
無論是抓取少還是304,這都是一種現象,并不是問題的原因,假設網站返回的都是200,就能(néng)達到提升排名(míng)帶來流量的目的麽?相比之下更應該思考産(chǎn)生304的原因是什麽?改304對網站目标能(néng)夠有(yǒu)什麽樣的效果?不能(néng)忽視整體(tǐ)的目标而強調過程的細節,為(wèi)了200而去解決304。
304狀态是如何産(chǎn)生?
服務(wù)器為(wèi)了提高網站訪問速度,對之前訪問的部分(fēn)頁(yè)面制定緩存機制,當客戶端在此對這些頁(yè)面進行請求,服務(wù)器會根據緩存内容判斷頁(yè)面與之前是否相同,若相同便直接返回304,此時客戶端調用(yòng)緩存内容,不必進行二次下載,可(kě)以說304從某種角度起到了減少服務(wù)器帶寬并提高蜘蛛爬行效率的作(zuò)用(yòng)。
304狀态産(chǎn)生原因?
1、頁(yè)面更新(xīn)周期長(cháng)或不更新(xīn)
2、純靜态頁(yè)面或強制生成靜态html
304狀态處理(lǐ)思路?
1、先對産(chǎn)生304頁(yè)面進行細分(fēn),到底是哪類頁(yè)面返回了304?這些頁(yè)面是否應該返回304?
2這些頁(yè)面生成的方式是怎樣的?是否有(yǒu)更新(xīn)機制?更新(xīn)機制是否符合蜘蛛對網站的抓取頻率?
3、頁(yè)面更新(xīn)區(qū)域的位置是否合理(lǐ)?是否位于該頁(yè)面主要内容的承載區(qū)
304狀态碼出現過多(duō)會造成以下問題:
1、網站快照停止
2、收錄減少
3、權重下降
那麽如何減少304返回碼呢(ne)?
據我所知,首先内容更新(xīn)方面要迎合百度蜘蛛,分(fēn)析日志(zhì),把蜘蛛到訪的時間記錄下來,可(kě)以大緻得出蜘蛛到訪的頻率,然後以此為(wèi)依據,更新(xīn)文(wén)章:一定是原創+轉載,不能(néng)純采集。轉載也需要最新(xīn)最好的優質(zhì)資源。讓蜘蛛這個點過來能(néng)有(yǒu)吃的。從而返回更多(duō) 200 正常碼。
其次呢(ne),最好增加個互動版塊,現在大網站基本已經都做了這方面,比如評論、留言等,大網站更新(xīn)起來變化可(kě)能(néng)會很(hěn)小(xiǎo),但是有(yǒu)了這些互動,用(yòng)戶會在上面發些内容,網站會有(yǒu)很(hěn)多(duō)新(xīn)的東西。