午夜视频在线免费观看,欧洲永久精品大片ww免费网站,欧美一级AA大片片免费看视频,欧美日韩国产中字,日本国产高清不卡爽日本国产,中文字幕 亚洲精品 第1页,国产自拍久久久国产无码,日日草夜夜操,日日草夜夜操,国产色情综合五色丁香小说,91网站日日夜夜免费看,国产午夜福利亚洲第一,一级a毛片免费观看久久精品,欧美xx网站,曰本成片,9I国产视频,久久日本手机在线视频

SEO優(yōu)化

首頁(yè) > SEO優(yōu)化 > 濰坊網(wǎng)站優(yōu)化之搜索引擎抓取策略

濰坊網(wǎng)站優(yōu)化之搜索引擎抓取策略

搜索引擎的抓取是搜索引擎最基礎(chǔ)的工作,為后續(xù)的一切工作做鋪墊。抓取的少,抓取太多重復(fù)信息,抓取能力差直接影響用戶的使用體驗(yàn)。連抓取能力都做不好也不用談后面的信息提取、分析了。因此,搜索引擎?zhèn)円恢倍荚谔岣咦约旱淖ト∧芰Α?/span>

一,頁(yè)面抓取流程。

搜索引擎通過(guò)自己原有的域名列表,來(lái)進(jìn)入網(wǎng)站,再抓取網(wǎng)頁(yè),在通過(guò)頁(yè)面的鏈接,再進(jìn)到下一層網(wǎng)頁(yè),從而建立起龐大的域名列表、URL列表。

二,頁(yè)面抓取的方式

1,         廣度優(yōu)先

廣度優(yōu)先:是指將網(wǎng)站的主欄目抓取之后,然后再抓取主欄目下面的子欄目。廣度優(yōu)先要注意以下幾點(diǎn):

(1)重要網(wǎng)頁(yè)離主站點(diǎn)的一般比較近

(2)寬度優(yōu)先規(guī)則有利于多個(gè)爬蟲(chóng)合作爬取,先抓站內(nèi)后抓站外,封閉性強(qiáng)

(3)萬(wàn)維網(wǎng)的深度并不是想像中的深

           2,深度優(yōu)先

與廣度優(yōu)先正好相反,這種首先會(huì)選擇某個(gè)分支,繼而深入到不能深入的情況下才考慮其他分支的策略。通過(guò)這種方式能抓取到比較隱蔽的頁(yè)面,從而實(shí)現(xiàn)更多用戶的檢索要求

            3網(wǎng)頁(yè)重訪

由于頁(yè)面的更新的問(wèn)題,所以需要重新訪問(wèn)

            4不重復(fù)抓取

搜索引擎不會(huì)抓取信息幾乎一樣的兩個(gè)網(wǎng)頁(yè)。它會(huì)給原創(chuàng)的網(wǎng)頁(yè)予以更高權(quán)重。如何判斷原創(chuàng)?搜索引擎會(huì)根據(jù)修改時(shí)間,網(wǎng)站權(quán)重等因素綜合考慮。