搜索引擎基礎(chǔ)
定義:用戶根據(jù)關(guān)鍵詞搜索要尋找的東西,搜索引擎給予最準(zhǔn)確,最接近的結(jié)果。
組成:后臺:搜集信息
前臺:供用戶搜索(傳遞參數(shù)并返回值
后臺用于搜集網(wǎng)站信息的程序稱蜘蛛(爬蟲)
蜘蛛、爬蟲、機器人
定義:所謂的爬蟲、機器人、蜘蛛本人就是軟件程序,根據(jù)網(wǎng)頁中的鏈接在各個網(wǎng)頁之間穿梭爬行,不斷地在互聯(lián)網(wǎng)上搜索,收集網(wǎng)站的內(nèi)容,例如(文本和鏈接),將其保存到數(shù)據(jù)庫中并根據(jù)搜索引擎算法對網(wǎng)頁進(jìn)行排名。
二、搜索引擎的基本機構(gòu)
1、查詢界面(供用戶使用的)
2、爬蟲、蜘蛛、機器人(搜集信息)
3、數(shù)據(jù)庫(存儲數(shù)據(jù))
4、搜索引擎算法;
5、檢索和排序(根據(jù)位置、頻率、鏈接和點擊次數(shù)進(jìn)行排名調(diào)整)