介绍
介绍
福哥今天会带着大家完成网页蜘蛛的代码的最后一个部分,实现网页源代码内容写入MySQL数据库功能,实现网页信息写入ElasticSearch搜索引擎功能。这部分功能实现了之后,我们就可以转而去编写搜索引擎的前端UI功能的代码了。
要实现写入ElasticSearch就需要先连接ElasticSearch,并且需要设置一个索引名称。这些我们在前面已经准备好了,所以我们现在就可以编写相应的业务逻辑了。
实现全文搜索需要对每一个网页设置一个权重值,这个权重值在搜索结果排序时候是非常重要的。通常情况下页面权重就是所属域名的权重,我们只需要根据一些算法更新这个权重即可。