编辑推荐
本书采用浅显易懂的语言加以适当的配图为你详细解读Solr的每个技术点,让其中涉及的每个原理、机制都不再晦涩难懂。理论结合实践才能出真知,案例驱动的方式贯穿本书始终,希望读者能够多上机实践书中的每个示例,遵循“理解为主,实践为辅”的学习原则,学以致用并在自己所在公司企业内部部署Solr,充分施展Solr的威力,从而体现自己的个人价值。
内容简介
本书作者是国内较早接触Solr的技术专家之一,多年一直在Solr的研究、实践和布道的路上不遗余力、乐此不彼。本书立足全球视野,综合Solr技术的发展和应用、从业人员的学习曲线,以及中英文资料的供给情况,给自己设定了一个极高的目标:力争在内容的全面性、系统性、深浅度和实战性上概括所有的同类书。从完成的结果上来看,我们的目标接近完成,Solr的基础知识、核心技术、进阶知识和扩展知识悉数包括在内。
全书一共16章,分为上下两卷:
上卷(第1~10章)
全面、系统地讲解了Solr的基础知识和核心技术。包括部署、配置、Solr Core、Solr DIH、全量导入、增量导入、索引、中文分词、查询组件、Solr Facet、高亮、查询建议,以及企业如何在真实的项目中使用Solr。不仅讲解了基本概念和使用方法,而且还分析了各组件的内部工作机制。
下卷(第11~16章)
细致、深入地讲解了Solr的高级知识和拓展知识。
高级知识部分包括:Solr的高级查询及其各种查询技巧,如函数查询、地理空间查询、Facet嵌套等;SolrJ、SolrCloud、Spring Data Solr的使用详解和工作原理;Solr的多种性能优化技巧,如索引的性能优化、缓存的性能优化、查询的性能优化、JVM和Web容器的优化,以及操作系统级别的优化。
拓展知识中首先讲解了Solr的一些比较生僻的知识点,如伪域、多语种索引支持、安全认证,以及Solr 6.x中的SQL接口和Streaming表达式等;然后讲解了Solr与MapReduce、HDFS、Hbase、Kafka、Flume、Storm、Spark等大数据技术的结合使用的集成方法。
作者简介
兰小伟(网名:益达) 资深Java工程师,在Java技术上有很深的积累和造诣。国内较早接触Solr的技术专家之一,长期致力于Solr的技术研究、实践和生产环境部署,是Solr社区的积极参与者和实践者,以让Solr技术能够在中国得到广泛应用不遗余力并乐此不疲。
现就职于国美金融,曾就职于各种大大小小的创业型公司。个人技术涉猎广泛,除了Java之外,对JQuery、ExtJS、AngularJS等前端技术也有研究。
目录
Contents?目 录
序 言
第11章Solr高级查询 1
11.1Solr函数查询 2
11.1.1Function语法 2
11.1.2使用函数查询 4
11.1.3将函数计算值作为“伪域”返回 5
11.1.4根据函数进行排序 6
11.1.5Solr中的内置函数 7
11.1.6自定义函数 13
11.2Solr地理空间查询 16
11.2.1Solr地理空间简单查询 17
11.2.2Solr地理空间高级查询 19
11.3Pivot Facet 29
11.4Solr Subfacet 31
11.4.1Subfacet语法 32
11.4.2Subfacet复杂示例 32
11.5Solr Facet Function 34
11.5.1聚合函数 35
11.5.2聚合函数与Subfacet结合 35
11.5.3Solr中的Percentile函数 36
11.6JSON Facet API 39
11.6.1JSON Facet API简介 39
11.6.2JSON Facet简单使用 40
11.6.3Facet类型 41
11.6.4JSON Facet语法 41
11.6.5Term Facet 42
11.6.6Query Facet 43
11.6.7Range Facet 43
11.6.8Multi-Select Facet 44
11.7Interval Facet 47
11.8Hierarchical Facet 48
11.9Solr Stats组件 50
11.10 Solr Terms组件 52
11.11 SolrTerm Vector组件 54
11.12 Solr Query Elevation组件 56
11.13 Solr Result Clustering组件 59
11.14 本章总结 62
第12章Solr查询进阶篇 63
12.1Solr深度分页 63
12.2Solr自定义排序 66
12.3Solr Join查询 70
12.3.1跨Core Join 71
12.3.2跨Document Join 73
12.3.3Block Join 74
12.3.4Block Join Facet 77
12.4深入Solr相关性评分 79
12.4.1Field权重 79
12.4.2Term权重 80
12.4.3Payload权重 80
12.4.4Function权重 81
12.4.5邻近Term权重 82
12.4.6Document权重 83
12.4.7自定义Similarity插件 84
12.5Solr NRT近实时查询 86
12.6Solr Real-time Get查询 88
12.7Solr评分查询 90
12.8Solr MoreLikeThis组件 91
12.9Solr自定义Query Parser 95
12.10 本章总结 97
第13章SolrJ 98
13.1什么是SolrJ 98
13.2SolrJ的环境依赖与配置 99
13.3SolrClient介绍 101
13.4SolrJ简单使用 103
13.5SolrJ查询 106
13.6使用SolrJ高效导出数据 110
13.7SolrJ增量更新 111
13.8SolrJ原子更新 112
13.9使用SolrJ管理Core 116
13.9.1创建Core 117
13.9.2卸载Core 118
13.9.3加载Core 119
13.9.4交换Core 119
13.9.5重命名Core 120
13.9.6查看Core状态 120
13.9.7Core合并 120
13.9.8Core分裂 121
13.10 使用SolrJ管理schema.xml 122
13.10.1Field管理 122
13.10.2FieldType管理 127
13.10.3Schema管理 130
13.10.4Schema管理的事务性批量操作 132
13.11 使用SolrJ操作JSON Request API 133
13.12 使用Spring Data Solr 136
13.12.1Spring Data Solr环境搭建 136
13.12.2Spring Data Solr的CRUD 138
13.12.3Spring Data Solr中的查询 141
13.12.4Spring Data Solr中的Repository详解 143
13.12.5Spring Data Solr中Solr-Template工具类详解 146
第14章SolrCloud 153
14.1SolrCloud快速入门 153
14.2SolrCloud工作原理 156
14.2.1SolrCloud的核心概念 156
14.2.2SolrCloud中的Shard 157
14.2.3Collection VS Core 158
14.2.4索引文档路由 161
14.2.5Shard的几种状态 162
14.2.6Replica的几种状态 162
14.2.7Shard分割 163
14.2.8SolrCloud里的自动提交 163
14.2.9SolrCloud的分布式查询请求 164
14.2.10读写端的自动容错 171
14.2.11 Zookeeper 173
14.3SolrCloud集群搭建 182
14.3.1在Tomcat容器下搭建SolrCloud集群 183
14.3.2在Jetty容器下搭建SolrCloud集群 189
14.4SolrCloud的基本操作 194
14.4.1Solr环境变量设置 194
14.4.2创建Collection 195
14.4.3删除Collection 196
14.4.4启动Solr 196
14.4.5停止Solr 197
14.4.6查看Solr状态 198
14.4.7Collection健康检测 198
14.4.8管理Zookeeper上的配置文件 199
14.5SlorCloud配置详解 201
14.5.1solr.xml详解 201
14.5.2zoo.cfg详解 204
14.6SolrCloud分布式索引 205
14.6.1添加索引文档到SolrCloud 205
14.6.2SolrCloud里的近实时查询 206
14.7SolrCloud分布式查询 207
14.8SolrCloud Collection API 208
14.8.1Collection常用操作API 209
14.8.2Shard常用操作API 212
14.8.3Replica常用操作API 215
14.8.4集群管理API 216
14.9Solr索引主从复制 217
14.9.1索引复制简介 217
14.9.2索引复制的术语 218
14.9.3索引复制的配置 219
14.9.4配置索引复制中继器 221
14.9.5索引复制工作机制 222
14.9.6ReplicationHandler HTTP接口 223
14.10 跨数据中心的索引复制(CDCR) 224
14.10.1什么是CDCR 224
14.10.2CDCR的Push机制 225
14.10.3CDCR搭建 226
14.10.4CDCR配置详解 228
14.10.5CDCR的HTTP接口 229
14.10.6CDCR存在的限制 229
14.11本章总结 230
第15章Solr性能优化 231
15.1Schema设计的注意事项 232
15.2Solr索引更新与提交的优化建议 233
15.3索引合并性能调优 234
15.
Solr权威指南:下卷 下载 mobi epub pdf txt 电子书 格式