What's Hot

英雄榜:果尔网稿件征集启示

SEO优化案例分析 : 2013-11-23 14:25:27 - SEO资讯

你认可果尔网上的文章观点吗?你想把你心中的想法告诉大家吗?你愿意和果尔一起打造真正的纯SEO交流平台吗?……欢迎发送您的建议或意见,以及您的原创文章(请. ...

搜集信息的预处理-索引网页库

Posted:2013-11-27 09:16:47 - comments | 作者: @果尔 @ SEO培训学院 修订1.4 ID:7030

author

在搜索引擎原理中,给网页建立索引是一个很重要的工作,它预示着该网页已经得到搜索引擎的认可,有可能出现在搜索结果页面中,任何没有进入索引网页库的网页,都不可能出现在基于关键词查询的搜索结果页面中,而我们常说的索引网页库又是由网页索引文件和URL索引文件组成的。

索引网页库的组成

索引网页库的组成

索引网页库和网页数据库一样要存储海量的信息,因此在实际应用中,索引网页库也需要选择合理的数据结构,确保有紧凑的数据结构和高效的检索能力。

下面可以看看天网搜索引擎的网页索引文件和URL索引文件是什么样子的:

1、网页索引文件

网页索引文件

2、URL索引文件

URL索引文件

小结

有了索引网页库,搜索引擎才可以实现对某个特定的URL进行高效的定位,除此之外,搜索引擎还要对网页进行分词,然后建立关键词到网页的关系,该部分黄聪会在《3.1.2、搜集信息的预处理—中文分词技术》进行讲解。


果尔SEO,中国医疗美容机构SEO经验分享平台。本文头像LOGO署名文章版权所有,转载请注明出处。

更多

上一篇:搜集信息的预处理-系统结构