ITPub博客

首页 > 应用开发 > Java > SolrCloud集群

SolrCloud集群

原创 Java 作者:beifengwang 时间:2014-02-17 10:56:32 0 删除 编辑

SolrCloud 是基于Solr和Zookeeper的分布式搜索方案,是正在开发中的 Solr4.0 的核心组件之一,分布式服务框架是 Apache Hadoop的子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题。它的主要思想是使用 Zookeeper 作为集群的配置信息中心。当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud它是指Solr中一套新的潜在的分发能力、通过参数让你建立起一个高可用、容错的Solr服务集群。ZooKeeper的目的是为了减轻分布式应用程序所承担的协调任务。

ZooKeeper使用Java所编写,但是支持Java和C两种编程语言。它是一个开源分布式的服务,它提供了分布式协作,分布式同步,配置管理等功能。它提供了一些简单的操作,分布式的应用可以建立在同步、配置管理、分组和命名等服务的更高级别的实现的基础之上。使得分布式应用可以基于这些接口实现诸如同步、配置维护和分集群或者命名的服务。Zookper很容易编程接入,它使用了一个和文件树结构相似的数据模型。可以使用Java或者C来进行编程接入。Zookper的目的就是将分布式服务不再需要由于协作冲突而另外实现协作服务。ZooKeeper数据模型、命名空间以及节点的概念ZooKeeper数据模型和层次命名空间提供的命名空间与标准的文件系统非常相似。一个名称是由通过斜线分隔开的路径名序列所组成的。ZooKeeper中的每一个节点是都通过路径来识别。

基于Lucene4.6+Solr4.6+Heritrix1.14+S2SH实战开发从无到有垂直搜索引擎】课程按照一个从无到有的过程来展开。所有的数据,来自于互联网,用heritrix去抓取。对于抓取的数据,进行去重,去标签,然后利用lucene 和 solr 进行索引和搜索。整个课程,按照一个从无到有的过程来展开。所有的数据,来自于互联网,用heritrix去抓取。对于抓取的数据,进行去重,去标签,然后利用lucene 和 solr 进行索引和搜索。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/29212814/viewspace-1082403/,如需转载,请注明出处,否则将追究法律责任。

上一篇: SQLLite 数据库
下一篇: Web services框架
请登录后发表评论 登录
全部评论

注册时间:2013-10-15

  • 博文量
    118
  • 访问量
    265029