国产激情自拍亚洲精品国产精品精_亚洲欧美在线观看视频_国产精品美女久久久久网站_a毛片免费全部在线播放**_精品欧美一区二区在线观看欧美熟_成人久久网国产精品五月天||www.citydiscovery.com.cn,国产裸体美女永久免费无遮挡,国产女人水真多18毛片18精品,国产女人18毛片水真多1,国产农村妇女精品一二区,国产女人18毛片水真多18精品,国产农村妇女毛片精品久久||www.09033.cn ,日韩高清码中文字幕日韩_国产一区二区三区久久精品_在线高清亚洲精品二区_亚洲精品伊人yw尤物狠狠色||www.njsa.cn ,日本在线中文字幕第一视频,亚洲v国产v天堂a无码久久,一本久久a久久精品综合香蕉,无码专区6080yy国产电影,国产一级a毛一级a看免费人娇||www.yuvv.com.cn

您當(dāng)前的位置主頁 > SEO優(yōu)化 > 瀏覽文章

搜索引擎蜘蛛的抓取策略

來源:SEO優(yōu)化 2012-07-12

快速提升網(wǎng)站銷量,使用365webcall網(wǎng)站在線客服系統(tǒng)

這篇文章主要講解搜索引擎的蜘蛛爬蟲的工作原理,包括它的四種抓取策略。

首先呢,搜索引擎的蜘蛛抓取網(wǎng)頁是有著一定的規(guī)律,不會去隨便抓取網(wǎng)頁,并且呢,蜘蛛是通過超連接來抓取網(wǎng)頁的,我們剛剛說了,搜索引擎有四種抓取網(wǎng)頁的策略,下邊我們一一講解。

深度優(yōu)先

所謂深度優(yōu)先,就是蜘蛛在一個頁面中發(fā)現(xiàn)第一個超鏈接,然后爬取這個頁面,當(dāng)爬到第二個頁面后,在第二個頁面發(fā)現(xiàn)的第一個超鏈接,然后再順著往下爬,如下圖:

深度優(yōu)先,導(dǎo)致蜘蛛抓取的網(wǎng)頁的質(zhì)量,越來越低,并且在傳遞網(wǎng)站權(quán)重上,也有著根本的問題。

寬度優(yōu)先

在深度優(yōu)先上,搜索引擎有著根本的問題,那么在之后,搜索引擎又推出了蜘蛛抓取的第二個策略,也就是寬度優(yōu)先,寬度優(yōu)先指的是,蜘蛛會先把這個頁面所有的鏈接都爬一次,然后在順著這些鏈接往下爬,如下圖:

但是寬度優(yōu)先也存在著問題,那就是蜘蛛抓取的效率和質(zhì)量問題。

先寬后深 – 權(quán)重優(yōu)先

現(xiàn)在搜索引擎是寬度和深度優(yōu)先的結(jié)合,蜘蛛在抓取一個網(wǎng)頁的時候,會先把這個頁面所有的鏈接都抓取一次,然后再根據(jù)這些ULR的權(quán)重來判定,那個URL的權(quán)重高,那么就采用深度優(yōu)先,那個URL權(quán)重低,就采用寬度優(yōu)先或者不抓取。

重訪抓取策略

重訪抓取策略,是最后的一個,搜索引擎蜘蛛在抓取完這個網(wǎng)頁之后,然后根據(jù)這個頁面的權(quán)重、包括它的更新頻率、更新質(zhì)量、外鏈的數(shù)量等等來判定,那么對于權(quán)重高的頁面,蜘蛛會在相隔較短的時間段在回來重新抓取,比如新浪網(wǎng),權(quán)重很高,搜索引擎蜘蛛都是按照秒來重新抓取的。而對于一些權(quán)重較低的頁面,比如長期不更新的頁面,那么蜘蛛會隔好長時間在來抓取一次,比如我們常常搜索的百度大更新,蜘蛛就是對于一些網(wǎng)頁權(quán)重較低的頁面進行一次全部的抓取,一般情況,百度大更新,一個月一次。

本文來源 / 轉(zhuǎn)載留下版權(quán)

感謝 史占強 的投稿

文章編輯: 365webcall網(wǎng)上客服工具(www.365webcall.com)

我的評論

登錄賬號: 密碼: 快速注冊 | 找回密碼

平乡县| 樟树市| 武平县| 平山县| 福鼎市| 开原市| 奉化市| 军事| 遂宁市| 鄂托克前旗| 陵水| 阳东县| 将乐县| 平罗县| 蒙阴县| 连云港市| 潮安县| 额尔古纳市| 三门县| 利辛县| 广德县| 霍山县| 东乡县| 揭西县| 武汉市| 修武县| 开化县| 长丰县| 鹤山市| 辉县市| 青田县| 永新县| 涿州市| 越西县| 长泰县| 石棉县| 曲阳县| 文登市| 洛川县| 陵川县| 九寨沟县|