《Clojure数据分析秘笈》

《Clojure数据分析秘笈》 《Clojure数据分析秘笈》

  • 书名:《Clojure数据分析秘笈》
  • 分类:编程
  • 作者:(美)Eric Rochester
  • 出版社:机械工业出版社
  • 出版年:2014-8
  • 售价:59.00
  • 装订:平装
  • 页码:264

《Clojure数据分析秘笈》 内容介绍:

【编辑推荐】 国内首部系统介绍Clojure数据分析技术的著作,内容全面而深入,为高效利用Clojure进行数据分析提供最佳指导 通过大量典型Clojure数据分析案例全面解析Clojure数据分析的各种技术细节、方法和最佳实践,实战性强 【内容简介】 资深数据分析专家多年经验结晶,内容全面而深入,用清晰易懂的语言阐释使用Clojure进行数据分析的各种技术细节、方法和最佳实践。本书实战性强,包含大量典型Clojure数据分析案例,为快速掌握并灵活运用Clojure技术提供最佳指导。 本书共11章:第1章讨论如何从CSV文件、网页和链接语义网数据等不同类型数据源读入数据;第2章提供标准化数据、修正拼写错误和使用大数据集的策略和实现;第3章介绍Clojure的并发特性和如何通过这些特性简化程序;第4章讲解使用Clojure的并行处理功能提高数据处理速度;第5章讨论使用Cascalog处理Hadoop和Cascading库中的海量分布式数据;第6章介绍使用Incanter数据集的基础知识;第7章介绍使用Incanter进行统计数据分析的过程和方法;第8章讲解如何配置Clojure,使其与Mathematica和R交互;第9章主要介绍聚类、分类和Weka等更多的高级机器学习技术;第10章展示如何在Incanter中生成图和进行可视化;第11章讲解网页图表的创建,并包含利用强大的D3可视化库的一些方法。

作者(美)Eric Rochester介绍:

Eric Rochester 资深数据分析专家,精通Python、Java、R、C#等多种编程语言,有丰富的编程经验。目前,他重点关注函数式编程语言,包括Clojure和Haskell。他现任职于弗吉尼亚大学图书馆的学者实验室,负责帮助人文学科和本科生实现数字信息方面的研究计划。

《Clojure数据分析秘笈》 目录大纲:

前言
关于技术审校者
第1章 导入分析数据 1
1.1 引言 1
1.2 新建项目 1
1.3 将CSV数据读入Incanter数据集 2
1.4 将JSON数据读入Incanter数据集 4
1.5 使用Incanter读入Excel数据 5
1.6 从JDBC数据库读取数据 6
1.7 将XML数据读入Incanter数据集 9
1.8 从网页表中抓取数据 11
1.9 从网页中抓取文本数据 15
1.10 读取RDF数据 17
1.11 使用SPARQL读取RDF数据 20
1.12 整合不同格式的数据 24
第2章 清洗和校验数据 29
2.1 引言 29
2.2 使用正则表达式清洗数据 30
2.3 使用同义词映射保持一致性 31
2.4 识别并去除重复数据 33
2.5 标准化数字格式 35
2.6 调整词频值的度量 36
2.7 标准化日期和时间 38
2.8 大数据集的延迟处理 40
2.9 大数据集抽样 42
2.10 修正拼写错误 43
2.11 解析自定义数据格式 46
2.12 使用Valip校验数据 49
第3章 使用并发编程管理复杂度 51
3.1 引言 51
3.2 使用STM管理程序复杂度 52
3.3 使用agent管理程序复杂度 55
3.4 使用commute获得更好的性能 57
3.5 将agent和STM结合使用 58
3.6 使用ensure维护一致性 60
3.7 将安全的副作用引入STM中 63
3.8 使用validator维护数据一致性 65
3.9 使用watcher追踪处理过程 68
3.10 使用watcher调试并发程序 70
3.11 从agent中错误恢复 71
3.12 使用sized queue管理输入 73
第4章 使用并行编程提高性能 74
4.1 引言 74
4.2 使用pmap并行处理 75
4.3 使用Incanter并行处理 77
4.4 将蒙特卡罗模拟进行划分使pmap性能提升 79
4.5 使用模拟退火算法最优化分块大小 83
4.6 使用reducers并行处理 86
4.7 使用reducers生成在线统计 89
4.8 使用OpenCL和Calx驾驭你的GPU 91
4.9 使用类型提示 94
4.10 使用Criterium制定基准 96
第5章 使用Cascalog进行分布式数据处理 100
5.1 引言 100
5.2 使用Cascalog和Hadoop分布式处理 101
5.3 使用Cascalog查询数据 104
5.4 使用Apache HDFS分布数据 105
5.5 使用Cascalog解析CSV文件 108
5.6 使用Cascalog执行复杂查询 110
5.7 使用Cascalog聚合数据 112
5.8 定义新Cascalog操作符 113
5.9 组成Cascalog查询 116
5.10 处理Cascalog工作流中的错误 118
5.11 使用Cascalog转换数据 119
5.12 使用Pallet在云上执行Cascalog查询 120
第6章 使用Incanter数据集 126
6.1 引言 126
6.2 加载Incanter样例数据集 126
6.3 将Clojure数据结构加载到数据集中 127
6.4 使用view交互式查看数据集 129
6.5 将数据集转换为矩阵 130
6.6 在Incanter中使用infix公式 132
6.7 使用$选择列 133
6.8 使用$选择行 135
6.9 使用$where过滤数据集 136
6.10 使用$group-by对数据分组 138
6.11 将数据集另存为CSV和JSON 139
6.12 使用$join进行多数据集投影 141
第7章 使用Incanter准备并执行统计数据分析 144
7.1 引言 144
7.2 使用$rollup生成汇总统计 144
7.3 通过变量差别展示变化 146
7.4 调整变量以简化变量关系 148
7.5 使用Incanter Zoo处理时间序列数据 150
7.6 平滑数据以降低噪声 152
7.7 使用bootstrapping验证抽样统计 154
7.8 线性关系建模 156
7.9 非线性关系建模 158
7.10 多峰贝叶斯分布建模 162
7.11 使用本福德定律找出数据错误 165
第8章 使用Mathematica和R 167
8.1 引言 167
8.2 在Mac OS X和Linux系统中配置Mathematica与Clojuratica的交互环境 168
8.3 在Windows系统中配置Mathematica与Clojuratica的交互环境 170
8.4 在Clojuratica中调用Mathematica函数 172
8.5 在Clojuratica中向Mathematica发送矩阵 173
8.6 在Clojuratica中运行Mathematica脚本 174
8.7 从Mathematica中创建函数 175
8.8 在Mathematica中并行处理函数 176
8.9 配置R与Clojure交互 177
8.10 在Clojure中调用R的函数 179
8.11 将向量传入R 180
8.12 在Clojure中执行R文件 181
8.13 在Clojure中使用R绘图 183
第9章 聚类、分类和使用Weka 185
9.1 引言 185
9.2 将CSV和ARFF文件加载到Weka中 185
9.3 在Weka数据集中对列进行过滤和重命名 187
9.4 使用K-means聚类发现成组数据 190
9.5 在Weka中寻找层次聚类结构 195
9.6 在Incanter中使用SOM聚类 197
9.7 使用决策树分类数据 199
9.8 使用朴素贝叶斯分类器分类数据 201
9.9 使用支持向量机分类数据 203
9.10 使用Apriori算法发现数据中的关联 205
第10章 使用Incanter绘图 208
10.1 引言 208
10.2 使用Incanter创建散点图 209
10.3 使用Incanter创建柱形图 211
10.4 在柱形图中绘制非数值型数据 212
10.5 使用Incanter创建直方图 213
10.6 使用Incanter绘制函数 215
10.7 为Incanter图表加入方程式 216
10.8 为散点图加入直线 217
10.9 使用JFreeChart定制图表 218
10.10 将Incanter图保存为PNG格式 220
10.11 使用PCA绘制多维数据 221
10.12 使用Incanter创建动态图表 223
第11章 创建网页图表 225
11.1 引言 225
11.2 使用Ring和Compojure提供数据 226
11.3 使用Hiccup创建HTML网页 229
11.4 配置和使用ClojureScript 231
11.5 用NVD3创建散点图 234
11.6 用NVD3创建条形图 239
11.7 用NVD3创建直方图 242
11.8 使用力向布局进行图像可视化 244
11.9 用D3创建交互式可视化 248


微信扫一扫关注公众号

0 个评论

要评论图书请先登录注册

你也许想看:

The Definitive Guide to Drupal 7

《The Definitive Guide to Drupal 7》

Benjamin Melancon,Allie Micka,Amye Scavarda,Benjamin Doherty,Bojhan Somers,Jacine Rodriguez,Karoly Negyesi,Moshe Weitzman,Roy Scholten,Ryan Szrama,Sam Boyer,Stephane Corlosquet,Amanda Miller-Johnson,Andrew Grice,Dan Hakimzadeh.APRESS.2011-5-11

“The Definitive Guide to Drupal 7 is the most comprehensive b...”

Learning Cython Programming

《Learning Cython Programming》

Philip Herron.Packt Publishing.2013-9-25

“”

DTrace

《DTrace》

Brendan Gregg,Jim Mauro.Prentice Hall.2011-4-11

“The Oracle Solaris DTrace feature revolutionizes the way you...”

Programming Social Applications

《Programming Social Applications》

Jonathan LeBlanc.O'Reilly Media.2011-8-22

“Like all good web ventures, the Social Web has risen in prom...”

Advance Bash-Scripting Guide

《Advance Bash-Scripting Guide》

Mendel Cooper..

“此书是开源的,html版本:http://www.tldp.org/LDP/abs/html/ PDF版本:http:/...”

Beginning Android 3

《Beginning Android 3》

Mark Murphy.Apress.2011-4-29

“The vibrant and rich Android development platform, created b...”

Object-Oriented Software Construction

《Object-Oriented Software Construction》

Bertrand Meyer.Prentice Hall.2000-03-21

“Contents Preface V Foreword To The Second Edition Xiii About...”

Getting Started with Google Guava

《Getting Started with Google Guava》

Bill Bejeck.Packt Publishing.2013-8-14

“Write more robust code that is easier to read and maintain L...”

Clojure数据分析秘笈

《Clojure数据分析秘笈》

(美)Eric Rochester.机械工业出版社.2014-8

“【编辑推荐】 国内首部系统介绍Clojure数据分析技术的著作,内容全面而深入,为高效利用Clojure进行数据分析提供...”

C程序员从校园到职场

《C程序员从校园到职场》

周兆熊.人民邮电出版社.2015-9-1

“要成为一名合格的C程序员,仅仅依靠课堂上的所学所练是远远不够的,实际的软件开发对从业者提出了更高的要求。本书重在讲述从学...”

Akka in Action

《Akka in Action》

Raymond Roestenburg,Rob Bakker.Manning Publications.2014-3-28

“”

Programming C# 4.0

《Programming C# 4.0》

Ian Griffiths,Matthew Adams,Jesse Liberty.O'Reilly Media.2010-8-25

“With dynamic typing and many other new features, C# 4.0 has ...”

Making Isometric Social Real-Time Games with HTML5, CSS3, and Javascript

《Making Isometric Social Real-Time Games with HTML5, CSS3, and Javascript》

Mario Andres Pagella.O'Reilly Media.2011-9-9

“Walk through the process of designing and implementing from ...”

jQuery Mobile

《jQuery Mobile》

Jon Reid.O'Reilly Media.2011-7-7

“Native apps have distinct advantages, but the future belongs...”

逆向工程实战

《逆向工程实战》

[美] Bruce Dang,[法] Alexandre Gazet,[美] Elias Bachaalany,[法] Sébastien Josse.人民邮电出版社.2015-8

“本书是一本涵盖x86、x64和ARM操作系统的逆向工程类图书,由浅入深地讲解了包括Windows内核模式代码的恶意软件和...”

Reactive Design Patterns

《Reactive Design Patterns》

Roland Kuhn,Jamie Allen.Manning Publications Co..2015

“Modern distributed applications must deliver near-realtime p...”

Pro Android 4

《Pro Android 4》

Satya Komatineni,Dave MacLean.Apress.2012-3-7

“Pro Android 4 shows you how to build real-world and fun mobi...”

The Joy of Clojure

《The Joy of Clojure》

Michael Fogus,Chris Houser.Manning Publications.2011-4-4

“Clojure is a dynamic programming language that targets the J...”

ROOTKITS

《ROOTKITS》

霍格兰德.清华大学出版社.2007-4

“《ROOTKITS-Windows内核的安全防护》是目前第一本关于rootkit的详尽指南,包括rootkit的概念、它...”

我的第一本C++书

《我的第一本C++书》

陈良乔.华中科技大学出版社.2011-5-5

“每一个渴望学习C++语言的初学者都希望能够有一本全面的,实用的,同时又是生动有趣的入门书。这本入门书可以告诉这些初学者,...”