導讀 關于bt蜘蛛網(wǎng)站,蜘蛛bt搜索引擎這個問題很多朋友還不知道,今天小六來為大家解答以上的問題,現(xiàn)在讓我們一起來看看吧!1、搜索引擎“蜘蛛
關于bt蜘蛛網(wǎng)站,蜘蛛bt搜索引擎這個問題很多朋友還不知道,今天小六來為大家解答以上的問題,現(xiàn)在讓我們一起來看看吧!
1、搜索引擎“蜘蛛”指的是網(wǎng)絡爬蟲(又被稱為網(wǎng)頁蜘蛛,網(wǎng)絡機器人,在FOAF社區(qū)中間,更經(jīng)常的稱為網(wǎng)頁追逐者),是一種按照一定的規(guī)則,自動地抓取信息的程序或者腳本。
2、基于目標網(wǎng)頁特征的爬蟲所抓取、存儲并索引的對象一般為網(wǎng)站或網(wǎng)頁。
3、根據(jù)種子樣本獲取方式可分為:(1) 預先給定的初始抓取種子樣本;(2) 預先給定的網(wǎng)頁分類目錄和與分類目錄對應的種子樣本,如Yahoo!分類結(jié)構(gòu)等;(3) 通過用戶行為確定的抓取目標樣例,分為:(a) 用戶瀏覽過程中顯示標注的抓取樣本;(b) 通過用戶日志挖掘得到訪問模式及相關樣本。
4、其中,網(wǎng)頁特征可以是網(wǎng)頁的內(nèi)容特征,也可以是網(wǎng)頁的鏈接結(jié)構(gòu)特征等等。
本文分享完畢,希望對大家有所幫助。
標簽:
免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!