百度谷歌等搜索引擎工作的三个阶段:
1.爬行和抓取。2.预处理,索引程序对抓取来的页面数据进行文字提取、中文分词、去除停止词、消除噪声、去重、正向索引、倒排索引、链接关系计算、特殊文件处理。3.排名,用户输入关键词后,排名程序会调用索引数据库,计算相关性,然后按照一定的格式生成搜索结果页面。