Python制作统计图形

JerryHouse | python, 数据分析 | 2014-07-19

如何利用深度神经网络(DNN)进行多目标学习

JerryHouse | 数据分析 | 2017-11-19
在机器学习(ML)中,我们通常关心优化某个特定指标,不管它是某个基准上的分数还是业务KPI。为了做到这一点,我们通常训练一个模型或一组模型来完成我们想要的任务。然后我们微调和调整这些模型,直到它们的性能不再增加。虽然我们通常可以通过这种方式获得可接受的性能,但是仅仅专注于单一任务,我们忽略了可能帮助我们在我们关心的指标上做得更好的... [阅读全文]
ė 6如何利用深度神经网络(DNN)进行多目标学习已关闭评论 0, ,

Spark与Elasticsearch的整合

JerryHouse | elasticsearch, 数据分析 | 2017-10-09
Spark为大数据处理和大规模机器学习提供了很好的计算框架和丰富的编程接口,elasticsearch-spark是官方提供的elasticsearch插件,支持从elasticsearch中读取海量数据导入到spark和通过spark将海量数据导入到elasticsearch。 1.导入 <pre>object ReloadTask { val logger: Logger = LoggerFactory.getLogger("ReloadTask") de... [阅读全文]
ė 6Spark与Elasticsearch的整合已关闭评论 0,

spark之dataframe操作

JerryHouse | python, 数据分析 | 2017-08-01
spark之dataframe操作
spark创建dataframe data = sqlContext.createDataFrame([("Alberto", 2), ("Dakota", 2)], ["Name", "askdaosdka"]) data.show() data.printSchema() # Output #+-------+----------+ #| Name|askdaosdka| #+-------+----------+ #|Alberto| 2| ... [阅读全文]
ė 6spark之dataframe操作已关闭评论 0, ,

elasticsearch索引速度优化

JerryHouse | elasticsearch | 2017-03-21
elasticsearch索引速度优化
前一篇文章讲了elasticsearch排序插件,本文为elasticsearch官方的索引新能优化指南的翻译。 如果搜索的索引任务比较繁重(例如索引基础结构日志),我们可能会愿意牺牲一些elasticsearch的搜索性能以实现更快的索引速度。在这些情况下,搜索的量比较小,并且等待几秒钟才出搜索结果也是可以忍耐的,而不需要以毫秒级别返回搜索结果,可以做出一些权衡... [阅读全文]
ė 6elasticsearch索引速度优化已关闭评论 0,

windows安装xgboost

JerryHouse | python, 数据分析 | 2017-03-06
windows安装xgboost
下面是xgboost在windows上的安装文件,我会不定期更新: x86 Not GPU-enabled x86 GPU enabled x64 Not GPU-enabled x64 GPU enabled python接口安装步骤 git clone https://github.com/dmlc/xgboost.git xgboost_install_dir 将libxgboost.dll 拷贝到xgboost_install_dir\python-package\xgboost\ 文件夹中 进入xgboost_install_dir\python-package... [阅读全文]
ė 6windows安装xgboost已关闭评论 0,

国外最好的自由职业网站推荐

JerryHouse | 职业发展 | 2017-02-27
国外最好的自由职业网站推荐
友情提示,其中某些网站需要科学上网才能浏览,你懂的。 去年的这个时候,美国劳工统计局统计大约有1500万人属于自由职业者。预测到2020年这个数据将会增长到6000万人次,或者说我们国家将会有超过40%的人为劳动工作者。自由职业的发展是非常明显的:到处可见在咖啡店和共同办公空间的自由职业人,他们总是待在笔记本电脑前。他们离开传统工作,想要使... [阅读全文]
ė 6国外最好的自由职业网站推荐已关闭评论 0, , ,

2016年十大最热门的Python库

JerryHouse | python, web, 数据分析 | 2016-12-23
去年,我们回顾了我们认为是2015年最好的Python库,这在Python社区中广泛分享。一年过去了,现在是时候给予应有的评价,今年开源社区做了很棒的工作。再次,我们试图避免大多数已建立的选择,如Django,Flask等,这些是现在的标准选择。此外,这些库中的一些在2016年之前就存在了,但他们在今年的人气激增,或者我们认为他们是足够大,值得拥有。 1.Zap... [阅读全文]
ė 62016年十大最热门的Python库已关闭评论 0, , ,

你要的Python可视化工具都在这里

JerryHouse | 未分类 | 2016-12-22
你要的Python可视化工具都在这里
声明:本文是对这篇文章的总结,所有的例子都在本地实际运行过,并修复了原文中一些在python 3下运行时的bug。 简介 python的第三方包有多个选项来可视化数据,这给了我们更多的选择空间,但也正是由于这种多样性,确定使用哪一个可视化工具来完成任务时有挑战性。本文包含一些更受欢迎的示例,并说明如何使用它们来创建一个简单的条形图。本文使用到的... [阅读全文]
ė 6你要的Python可视化工具都在这里已关闭评论 0
Ɣ回顶部