400-685-0732

WJMonitor舆情之声

企业大数据智能舆情监测管理解决方案

全网监测海量数据按需发布监测预警

实时把握舆情动态精准追溯信息源头

获取验证码
企业采购 个人使用
当前位置: 首页 > SEO博客 > 基于Lucene的全文搜索服务器Solr简介

基于Lucene的全文搜索服务器Solr简介

时间:2012-01-21 14:20:09
在我的上一篇博客开源web搜索引擎nutch简介中,介绍了nutch的一些概念,今天我再来写一篇nutch的姊妹篇:Solr,它与nutch同宗同源,都是起源于apache的Lucene项目,而又各自相辅相成,相得益彰,自为一派。

solr

Solr定义:

Solr是一个流行、快速的开源企业搜索平台,它起源于Apache的Lucene项目。Solr主要的特色包括:强大的全文搜索能力,高亮突出显示关键词,动态集群化,数据库集成,富文本搜索(例如,Word、pdf文档等)等。Solr具有高扩展性,提供了分布式搜索,和索引复制,它使得互联网上具有搜索和导航特色的最大的网站的具有了更大的活力。

Solr是完全基于java来编写的,可以运行于一个servlet容器(例如Tomcat)作为单机版来运行。Solr采用Lucene Java搜索库作为其核心的全文本索引和搜索的模块,并且采用了REST-like的Http/Xml,以及Json API,这样使得使用其它编程语言集成进入变得更加方便。Solr的强大的外部配置工具允许其可以被精简成任何类型的应用,而不需要任何的java编程。Solr具有一个扩展的插件体系架构,使得可以完成更多高级的定制化的操作。

Solr架构:

solr架构

Solr的一些特色:

1,高级的全文搜索能力

2,高并发访问的优化

3,基于标准的开放接口:XML、Json和Http

4,综合而全面的Html管理界面

5,基于JMX监控的服务器统计

6,伸缩性强。可以有效地复制到其它Solr搜索服务器上

7,灵活性。可方便的通过Xml配置

8,扩展性强的插件体系。

Solr应用

一个基于Nutch+Solr的体系架构:

solr+nutch应用

既然Solr和Nutch这么强大,作为好的东西我们就要学习并好好使用,未来我们的SEOTcs系统也会采用搜索引擎的这两个框架,让我们的SEOTcs系统插上飞翔的翅膀,展翅高飞!
分享按钮