《Flume:构建高可用、可扩展的海量日志采集系统》

《Flume:构建高可用、可扩展的海量日志采集系统》 《Flume:构建高可用、可扩展的海量日志采集系统》

  • 书名:《Flume:构建高可用、可扩展的海量日志采集系统》
  • 分类:计算机
  • 作者:【美】Hari Shreedharan(哈里•史瑞德哈伦)
  • 出版社:电子工业出版社
  • 出版年:2015-8-1
  • 售价:69.00元
  • 装订:平装
  • 页码:232

《Flume:构建高可用、可扩展的海量日志采集系统》 内容介绍:

《Flume:构建高可用、可扩展的海量日志采集系统》从Flume 的基本概念和设计原理开始讲解,分别介绍了不同种类的组件、如何配置组件、如何运行Flume Agent 等。同时,分别讨论Source、Channel 和Sink 三种核心组件,不仅仅阐述每个组件的基本概念,而且结合实际的编程案例,深入、全面地介绍每个组件的详细用法,并且这部分内容也是整个Flume 框架的重中之重。之后,讲解拦截器、Channel选择器、Sink 组和Sink 处理器等内容,它们为Flume 提供灵活的扩展支持。最后,介绍了Flume 的高级使用,如何使用Flume 软件开发工具集(SDK)和Embedded Agent API,如何设计、部署和监控Flume 生产集群。 总而言之,《Flume:构建高可用、可扩展的海量日志采集系统》是一本理论结合实战,深度、广度兼备的海量日志采集系统的著作。

作者【美】Hari Shreedharan(哈里•史瑞德哈伦)介绍:

Hari Shreedharan是Cloudera的一名软件工程师,他工作于Apache Spark、Apache Flume和Apache Sqoop。他也是Flume项目的一个提交者和PMC成员,帮助项目的方向做决定。

《Flume:构建高可用、可扩展的海量日志采集系统》 目录大纲:

译者序 ........................................................................... v
序 ................................................................................xiii
前言 ............................................................................... x
第1 章 认识Apache Hadoop 和Apache HBase ............ 1
分布式文件系统HDFS ..........................................................................................1
HDFS 的数据格式 ...........................................................................................3
处理HDFS 中的数据 ......................................................................................4
Apache HBase ........................................................................................................4
总结 .......................................................................................................................5
参考文献 ................................................................................................................6
第2 章 用Apache Flume 处理流数据 ............................ 7
我们需要Flume .....................................................................................................7
Flume 是否适合呢? .............................................................................................9
Flume Agent 内部原理 .........................................................................................10
配置Flume Agent .................................................................................................13
Flume Agent 之间的相互通信 ..............................................................................17
复杂的流 ..............................................................................................................17
复制数据到不同目的地 ........................................................................................20
动态路由 ..............................................................................................................21
Flume 的无数据丢失保证,Channel 和事务 ........................................................22
Flume Channel 中的事务 ...............................................................................23
Agent 失败和数据丢失 ........................................................................................25
批量的重要性 ......................................................................................................26
重复怎么样? ......................................................................................................27
运行Flume Agent .................................................................................................27
总结 .....................................................................................................................29
参考文献 ..............................................................................................................30
第3 章 源(Source) .................................................. 31
Source 的生命周期 ...............................................................................................31
Sink-to-Source 通信 .............................................................................................33
Avro Source ...................................................................................................34
Thrift Source .................................................................................................37
RPC Sources 的失败处理 ..............................................................................39
HTTP Source ........................................................................................................40
针对HTTP Source 写处理程序* ..................................................................42
Spooling Directory Source ....................................................................................47
使用Deserializers 读取自定义格式* ............................................................50
Spooling Directory Source 性能.....................................................................55
Syslog Source .......................................................................................................55
Exec Source ..........................................................................................................59
JMS Source ..........................................................................................................61
转换JMS 消息为Flume 事件* .....................................................................63
编写自定义Source* .............................................................................................65
Event-Driven Source 和Pollable Source ........................................................66
总结 .....................................................................................................................73
参考文献 ..............................................................................................................73
第4 章 Channel ......................................................... 75
事务工作流 ..........................................................................................................76
Flume 自带的Channel .........................................................................................78
Memory Channel ...........................................................................................78
File Channel ..................................................................................................80
总结 .....................................................................................................................86
参考文献 ..............................................................................................................86
第5 章 Sink ............................................................... 87
Sink 的生命周期 ..................................................................................................88
优化Sink 的性能 .................................................................................................89
写入到HDFS :HDFS Sink ..................................................................................89
理解Bucket ...................................................................................................90
配置HDFS Sink ............................................................................................93
使用序列化器控制数据格式* ..................................................................... 100
HBase Sink ......................................................................................................... 106
用序列化器将Flume 事件转换成HBase Put 和Increment* ....................... 108
RPC Sink ............................................................................................................ 113
Avro Sink ..................................................................................................... 113
Thrift Sink ................................................................................................... 115
Morphline Solr Sink ........................................................................................... 116
Elastic Search Sink ............................................................................................. 119
自定义数据格式* ....................................................................................... 121
其他Sink :Null Sink、Rolling File Sink 和Logger Sink .................................. 124
编写自定义Sink* .............................................................................................. 125
总结 ................................................................................................................... 129
参考文献 ............................................................................................................ 129
第6 章 拦截器、Channel 选择器、Sink 组和
Sink 处理器 ................................................... 131
拦截器 ................................................................................................................ 131
时间戳拦截器 .............................................................................................. 132
主机拦截器 ................................................................................................. 133
静态拦截器 ................................................................................................. 133
正则过滤拦截器 .......................................................................................... 134
Morphline 拦截器 ........................................................................................ 135
UUID 拦截器 ............................................................................................... 136
编写拦截器* ............................................................................................... 137
Channel 选择器 .................................................................................................. 140
复制Channel 选择器 ................................................................................... 140
多路复用Channel 选择器 ........................................................................... 141
自定义Channel 选择器* ............................................................................ 144
Sink 组和Sink 处理器 ....................................................................................... 146
Load-Balancing Sink 处理器 ....................................................................... 148
Failover Sink 处理器 ................................................................................... 151
总结 ................................................................................................................... 153
参考文献 ............................................................................................................ 154
第7 章 发送数据到Flume* ....................................... 155
构建Flume 事件 ................................................................................................ 155
Flume 客户端SDK ............................................................................................. 156
创建Flume RPC 客户端 .............................................................................. 157
RPC 客户端接口 ......................................................................................... 157
所有RPC 客户端的公共配置参数 .............................................................. 158
默认RPC 客户端......................................................................................... 165
Load-Balancing RPC 客户端 ....................................................................... 168
Failover RPC 客户端 ................................................................................... 171
Thrift RPC 客户端 ....................................................................................... 172
嵌入式Agent ..................................................................................................... 173
配置嵌入式Agent ....................................................................................... 175
log4j Appender ................................................................................................... 180
Load-Balancing log4j Appender ................................................................... 181
总结 ................................................................................................................... 182
参考文献 ............................................................................................................ 183
第8 章 规划、部署和监控Flume ............................... 185
规划一个Flume 部署 ......................................................................................... 185
修复时间 ..................................................................................................... 185
我的Flume Channel 需要多少容量? ......................................................... 186
多少层? ..................................................................................................... 186
通过跨数据中心链接发送数据 .................................................................... 188
层分片 ......................................................................................................... 190
部署Flume ......................................................................................................... 191
部署自定义代码 .......................................................................................... 191
监控Flume ......................................................................................................... 193
从自定义组件报告度量 ............................................................................... 196
总结 ................................................................................................................... 196
参考文献 ............................................................................................................ 196
索引 ........................................................................... 197


微信扫一扫关注公众号

0 个评论

要评论图书请先登录注册

你也许想看:

Cloud Design Patterns

《Cloud Design Patterns》

Alex Homer,John Sharp,Larry Brader,Masashi Narumoto,Trent Swanson.Microsoft patterns & practices.2014-2-17

“”

有效的单元测试

《有效的单元测试》

科斯凯拉 (Lasse Koskela).机械工业出版社.2014-11-1

“《有效的单元测试》是一本关于单元测试的专著,由资深敏捷技术实践专家撰写,不仅系统且深入地阐释了单元测试用于软件设计的工具...”

C/C++深层探索

《C/C++深层探索》

姚新颜.人民邮电出版社.2002-12

“《C/C++ 深层探索》试图通过近50节的内容带领读者从各个方面去把握C/C++的语法、语义,并通过分析C/C++编译器...”

The Art of Unit Testing

《The Art of Unit Testing》

Roy Osherove.Manning Publications.2009-06-03

“HIGHLIGHT Here's what Michael Feathers, an Agile rock star i...”

C现代编程

《C现代编程》

[日] 花井志生.人民邮电出版社.2016-4

“本书主要讲解如何将集成开发环境、设计模式、极限编程、测试驱动开发、重构、持续集成这些现代编程方法应用到C语言的嵌入式开发...”

Nmap 6

《Nmap 6》

Calderon Pale Paulino.Packt Publishing.2012-10-14

“Nmap is a well known security tool used by penetration teste...”

Java程序员面试宝典(第4版)

《Java程序员面试宝典(第4版)》

欧立奇,朱梅,段韬.电子工业出版社.2015-10-1

“本书是《Java程序员面试宝典》的第4版,同时也是《程序员面试宝典》的姊妹书。 第4版在保留前三版数据结构、字符串处理、...”

java语言袖珍指南

《java语言袖珍指南》

Robert Liguori,Patricia Liguori.O'Reilly.2014-11

“当你需要快速查找编写或调试Java程序方面的知识时,本指南可使你方便地参考Java编程语言及其平台的标准功能。你从中会找...”

现代信息检索

《现代信息检索》

Ricardo Baeza-Yates,Berthier Ribeiro-Neto,王知津,贾福新,郑红军.机械工业出版社.2005-3-1

“本书介绍了现代信息检索的绝大部分研究领域,全面展示了现代信息检索的基础知识和高级主题,涉及该领域的各个方面。本书的两位主...”

Introducing Data Science

《Introducing Data Science》

Davy Cielen,Arno Meysman.Manning Publications.2016-1-31

“”

精通XPages

《精通XPages》

Martin Donnelly,Mark Wallace,Tony McGuckin.人民邮电出版社.2012-11

“《精通XPages:XPages应用开发和XSP语言权威指南》是一本介绍如何使用XPages进行Web开发的书,书中使用...”

Learning Nagios 4

《Learning Nagios 4》

Wojciech Kocjan.Packt Publishing - ebooks Account.2014-3-25

“”

Python Machine Learning

《Python Machine Learning》

Sebastian Raschka.Packt Publishing - ebooks Account.2015-9

“About This Book Leverage Python' s most powerful open-source...”

See MIPS Run, Second Edition

《See MIPS Run, Second Edition》

Dominic Sweetman.Morgan Kaufmann.2006-10-31

“”

A Primer on Memory Consistency and Cache Coherence

《A Primer on Memory Consistency and Cache Coherence》

Mark Hill.Morgan & Claypool.2012-3-12

“Many modern computer systems and most multicore chips (chip ...”

大学计算机——计算思维导论

《大学计算机——计算思维导论》

战德臣,聂兰顺.电子工业出版社.2013-8

“本书是教育部大学计算机课程改革项目成果,是大学计算科学、计算思维通识教育类课程的最新教材。全书以计算学科体现出的解决社会...”

Excel 2003高级VBA编程宝典

《Excel 2003高级VBA编程宝典》

John Walkenbach.电子工业出版社.2005-10

“本书是专门为在Excel 2003中使用VBA编程而编写的一部专著。 全书共分8个部分,主要包括Excel 2003的基...”

全国计算机等级考试·上机考试题库

《全国计算机等级考试·上机考试题库》

全国计算机等级考试命题中心,未来教育教学与研究中心主编.电子科技大学出版社.2014-3

“根据教育部考试中心《关于全国计算机等级考试体系调整的通知》(教试中心函[2013]29号)文件精神,将对NCRE体系进行...”

共创未来

《共创未来》

彼得・韦纳.上海科技教育出版社.2002-12

“哲人石丛书·当代科普名著系列。 一场革命——在未来甚至可能将强大的微软公司拖下王位的革命——正在横扫软件领域。比尔·盖茨...”

iOS游戏开发

《iOS游戏开发》

Todd Moore.人民邮电出版社.2013-1

“《iOS游戏开发:从创意到实现》(作者穆尔)是一部应运而生的实用指南,讲述了如何构建出能在Apple Store中引人注...”