以文本方式查看主题

-  康柏仕电脑学院  (http://combss.com/bbs/index.asp)
--  硬件及网络技术资料储存区  (http://combss.com/bbs/list.asp?boardid=61)
----  百度谷歌等搜索引擎的工作原理  (http://combss.com/bbs/dispbbs.asp?boardid=61&id=3396)

--  作者:轻轻风聆
--  发布时间:2012/8/9 8:57:04
--  百度谷歌等搜索引擎的工作原理

图片点击可在新窗口打开查看此主题相关图片如下1.jpg:
图片点击可在新窗口打开查看

百度谷歌等搜索引擎工作的三个阶段:

1.爬行和抓取。
2.预处理,索引程序对抓取来的页面数据进行文字提取、中文分词、去除停止词、消除噪声、去重、正向索引、倒排索引、链接关系计算、特殊文件处理。
3.排名,用户输入关键词后,排名程序会调用索引数据库,计算相关性,然后按照一定的格式生成搜索结果页面。