elasticsearch中模块(module)和插件(plugin)的不同之处

JerryHouse | 未分类 | 2016-12-20
elasticsearch中模块(module)和plugin(插件)都是Plugin类的子类,那么插件和模块之前有什么不同呢?elasticsearch的源码为什么要把它们拆分成不同的子项目? 例如lang-painless模块 public final class PainlessPlugin extends Plugin implements ScriptPlugin lang-python插件 public class PythonPlugin extends Plugin implements ScriptPlugi... [阅读全文]
ė 6elasticsearch中模块(module)和插件(plugin)的不同之处已关闭评论 0

Pandas dataframe数据写入文件和数据库

JerryHouse | 未分类 | 2016-12-14
Pandas dataframe数据写入文件和数据库
Pandas是Python下一个开源数据分析的库,它提供的数据结构DataFrame极大的简化了数据分析过程中一些繁琐操作,DataFrame是一张多维的表,大家可以把它想象成一张Excel表单或者Sql表。之前这篇文章已经介绍了从各种数据源将原始数据载入到dataframe中,这篇文件介绍怎么将处理好的dataframe中的数据写入到文件和数据库中。 首先我们通过二维ndarray创建一... [阅读全文]
ė 6Pandas dataframe数据写入文件和数据库已关闭评论 0

Java 8的新特性

JerryHouse | 未分类 | 2016-12-09
Java 8为开发者提供了更多的语法糖,可以减少冗长的输入,提高开发人员的效率,本文列举我工作中常用的语法。 1.数组转为List 如果是对象数组,例如将String数组转为list: String[] arr = new String[]{"a", "b"}; List<String> list = Arrays.asList(arr); 如果是原型数据,例如将int数组转为list: ... [阅读全文]
ė 6Java 8的新特性已关闭评论 0

Elasticsearch排序的一些心得

JerryHouse | 未分类 | 2016-11-29
本文收集了Elasticsearch排序的一些场景和常用的解决方案。 case 1: ES索引存放的是文章,文章有个作者Id属性,搜索到的文章结果想限制同一作者出现的文章结果数目(例如每个作者限制一条或者两条),请问如何实现? 我们使用es时一般使用的是TopScoreDocCollector,得分最高的文章排在前面,这种情况下可以自定义自己的collector,当碰到同一作者出现... [阅读全文]
ė 6Elasticsearch排序的一些心得已关闭评论 0

搜索分词的一些心得

JerryHouse | 未分类 | 2016-11-29
为什么在分词的时候,要考虑歧义消除? 举个常用的例子:尝试对这句话“严守一把手机关了”进行分词,能够分出的词有“严守、严守一、一把、一把手、把手、手机、机关、关了”。正常我们搜索“机关”这个词时肯定不希望匹配到包含这句话的文档,消除歧义就可以避免这种情况的出现。 [阅读全文]
ė 6搜索分词的一些心得已关闭评论 0

elasticsearch中的field data(正排索引)

JerryHouse | elasticsearch, 搜索 | 2016-01-04
之前的文章有讲到elasticsearch filter和query的区别,其中filter就要用到field data这种数据结构。Elasticsearch cluster中的内存多半都被消耗在了field data(也就是我们常说的正排索引)上,field data主要用于: 按照字段排序(sort) 按照字段进行聚合(Aggregations) 过滤器,例如地理位置过滤 script排序中使用到某些字段 倒排索引的结构如下,这... [阅读全文]
ė 6elasticsearch中的field data(正排索引)已关闭评论 0, , ,

python数据库操作

JerryHouse | mysql, python | 2015-12-30
目前python已经广泛应用于数据分析和网站建设,而不论是数据分析还是网站建设都涉及到了数据库操作。 利用python对数据库中的数据进行操作的第一步就是安装相应的数据库模块,以mysql为例,一般先要安装mysqlclient模块。作者当时在ubuntu的机器上安装mysqlclient时碰到了各种莫名其妙的错误,现将正确的安装姿势总结如下: 1.ubuntu下python版本为2.x... [阅读全文]
ė 6python数据库操作已关闭评论 0,

网页载入速度优化

JerryHouse | web | 2015-12-29
网页载入速度优化
要优化网页的载入速度,首先要知道从用户发起请求到页面被完全展现依次经历了哪些步骤:1)域名解析 2)建立http链接 3)浏览器发送http请求 4)服务器返回页面内容 5)浏览器接收页面,下载静态资源,例如:图片,CSS,JS 5)浏览器进行渲染,页面载入缓慢时应该对依次对这些环节进行检查。 1. 域名解析和网络链接检查 DNS服务器将域名映射为... [阅读全文]
ė 6网页载入速度优化已关闭评论 0, ,
Ɣ回顶部