当前位置 :
索引的原理
更新时间:2020-11-06 00:00:00

搜索引擎的工作原理可分为三个过程:首先在互联网中发现、搜集网页信息,其次对信息进行提取和组建索引库,最后再由检索器根据用户输入的关键词,在索引库中快速找到文档,进行文档与查询的相关度评价,对输出的结果进行排序,并将查询结果呈现给用户。

搜索引擎不能真正理解网页上的内容,他只是机械地匹配网页上的文字,而真正意义上的搜索引擎通常指是收集了互联网上几千万到几十亿个网页并对网页中的每一个字进行索引,从而建立索引数据库的全文搜索引擎。

典型的搜索引擎由三个模块组成:

1、信息采集模块:信息采集器是一个可以浏览网页的程序,它在进入到一个网页后会把该网页的链接作为浏览的起始地址,把被链接的网页获取过来,抽取网页中出现的链接,并通过一定的算法决定下一步要访问哪些链接。

2、查询表模块:查询表模块就是一个全文索引数据库。

3、检索模块:检索模块是实现检索功能的程序,其作用是将用户输入的检索表达式拆分为具有表达意义的字或者词,通过一定的算法获得相应的检索结果。

保卡通专稿内容,转载请注明出处
不够精彩?
保卡通(baokatong.com)汇总了汉语字典,新华字典,成语字典,组词,词语,在线查字典,中文字典,英汉字典,在线字典,康熙字典等等,是学生查询学习资料的好帮手,是老师教学的好助手。
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
Copyright©2009-2021 保卡通 baokatong.com 版权所有