搜索引擎的原理基本分做哪三步?

来源:企讯网 发布日期:2016-07-01

第一步:从互联网上搜集信息
  网络蜘蛛Spider,是一个很形象的名字,把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。
第二步:整理信息、建立索引数据库
  搜索引擎由分析索引系统程序对收集回来的网页进行分析,提取相关网页所在网址链接、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等信息,根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
第三步:在索引数据库中搜索排序、接受查询
  当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页,因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。

您可能感兴趣的商机信息
关于我们 | 联系我们 | 付款说明 | 法律声明 | 服务条款 | 东莞网站建设 | 114城市信息导航 | 找回密码
服务热线:400 612 0769 传真:0769-22020338 版权所有 广东朝阳企讯通科技有限公司 粤ICP备15113932号
在线客服系统

在线咨询