獨家|樂視汽車莫干山工廠探營 三天三夜還原一場發(fā)布會 |
發(fā)布時間:2016-12-30 文章來源: 瀏覽次數(shù):3236 |
百度蜘蛛,英文名是“baiduspider”是百度搜索引擎的一個自動程序。它的作用是訪問互聯(lián)網(wǎng)上的html網(wǎng)頁(當然動態(tài)頁面也可以抓取),建立索引數(shù)據(jù)庫,使用戶能在百度搜索引擎中搜索到您網(wǎng)站的網(wǎng)頁。 常見題目 1。Baiduspider對一個網(wǎng)站服務器造成的訪問壓力如何? 答:Baiduspider會自動根據(jù)服務器的負載能力調節(jié)訪問密度。在連續(xù)訪問一段時間后,Baiduspider會暫停一會,以防止增大服務器的訪問壓力。所以在一般情況下,Baiduspider對您網(wǎng)站的服務器不會造成過大的壓力。 2。為什么Baiduspider不停的抓取我的網(wǎng)站? 答:或許您的網(wǎng)站權重高或者對于您網(wǎng)站上新產(chǎn)生的或者持續(xù)、有規(guī)律更新的頁面,Baiduspider會持續(xù)抓取。此外,您也可以檢查網(wǎng)站訪問日志中Baiduspider的訪問是否正常,以防止有人惡意冒充Baiduspider來頻繁抓取您的網(wǎng)站。 假如您發(fā)現(xiàn)Baiduspider非正常抓取您的網(wǎng)站,請反饋至,并請盡量給出Baiduspider對貴站的訪問日志,以便于我們跟蹤處理。 3。我不想我的網(wǎng)站被Baiduspider訪問,我該怎么做? 答:Baiduspider遵守互聯(lián)網(wǎng)robots協(xié)議。您可以利用robots.txt文件完全禁止Baiduspider訪問您的網(wǎng)站,或者禁止Baiduspider訪問您網(wǎng)站上的部門文件。 留意:禁止Baiduspider訪問您的網(wǎng)站,將使您的網(wǎng)站上的網(wǎng)頁,在百度搜索引擎以及所有百度提供搜索引擎服務的搜索引擎中無法被搜索到。 ps:關于robots.txt的寫作方法,請參看我們的先容:robots.txt寫作方法 4。為什么我的網(wǎng)站已經(jīng)加了robots.txt,還能在百度搜索出來? 答:由于搜索引擎索引數(shù)據(jù)庫的更新需要時間。固然Baiduspider已經(jīng)休止訪問您網(wǎng)站上的網(wǎng)頁,但百度搜索引擎數(shù)據(jù)庫中已經(jīng)建立的網(wǎng)頁索引信息,可能需要二至周圍才會清除。 另外也請檢查您的robots配置是否準確。 5。我但愿我的網(wǎng)站內(nèi)容被百度索引但不被保留快照,我該怎么做? 答:Baiduspider遵守互聯(lián)網(wǎng)metarobots協(xié)議。您可以利用網(wǎng)頁meta的設置,使百度顯示只對該網(wǎng)頁建索引,但并不在搜索結果中顯示該網(wǎng)頁的快照。 和robots的更新一樣,由于搜索引擎索引數(shù)據(jù)庫的更新需要時間,所以固然您已經(jīng)在網(wǎng)頁中通過meta禁止了百度在搜索結果中顯示該網(wǎng)頁的快照,但百度搜索引擎數(shù)據(jù)庫中假如已經(jīng)建立了網(wǎng)頁索引信息,可能需要二至周圍才會在線上生效。 6。百度蜘蛛在robots.txt中的名字是什么? 答:“Baiduspider” 首字母B大寫,其余為小寫。 Baiduspider多長時間之后會重新抓取我的網(wǎng)頁? 答:百度搜索引擎每周更新,網(wǎng)頁視重要性有不同的更新率,頻率在幾天至一月之間,Baiduspider會重新訪問和更新一個網(wǎng)頁。 7。Baiduspider抓取造成的帶寬堵塞? 答:Baiduspider的正常抓取并不會造成您網(wǎng)站的帶寬堵塞,造成此現(xiàn)象可能是因為有人冒充baidu的spider惡意抓取。假如您發(fā)現(xiàn)有名為Baiduspider的agent抓取并且造成帶寬堵塞,請盡快和我們聯(lián)系。您可以將信息反饋至百度網(wǎng)頁投訴中央,假如能夠提供您網(wǎng)站該時段的訪問日志將更加有利于我們的分析。 |
|