实战Hadoop


请输入要查询的词条内容:

实战Hadoop




概述


《实战Hadoop》是中国电子学会云计算专家委员会刘鹏教授主编的国内第一本原著的Hadoop编程技术书籍。它由电子工业出版社于2011年9月出版,并在首届中国云计算技术与应用大会上首发。作为谷歌云计算技术的开源实现,Hadoop是目前最受关注的云计算技术平台。该书强调动手、强调实战,以风趣幽默的语言和一系列生动的应用实例,系统地讲授了Hadoop的核心技术和扩展技术,包括:MapReduce、HDFS、HBase、Hive、Pig、Cassandra、Chukwa和ZooKeeper等,并给出了3个完整的基于Hadoop的云计算综合应用实例,及保障Hadoop平台可靠运行的方法。本书主要作者来自国内少有的拥有丰富经验的云计算技术研发团队。

读者对象


云计算研发人员,包括院校、科研机构师生和科研人员,各类云计算技术企业和应用企业研发人员

图书目录


第1章 神奇的大象——Hadoop

1.1 初识神象 1.2 Hadoop初体验 1.3 Hadoop世界的风俗

第2章 分久必合——MapReduce

2.1 MapReduce基础

2.2 一切从“Hello World”开始——文字计数

2.3 MapReduce,你够了解吗?

2.5 实战:倒排索引

2.4 实战:用MapReduce进行海量数据排序

第3章 HDFS:不怕故障的海量存储

3.1 开源的GFS——HDFS 3.3 HDFS API之旅 3.4 文件操作示例

3.5 实战:用HDFS存储海量视频数据

第4章 HBase:一张无限大的表

4.1 HBase数据模型

4.2 HBase的入门仪式

4.3 HBase操作演练

4.4 HBase查询语言HBQL

4.4 实战:用HBase管理通话记录数据

第5章 MapReduce进阶

5.1复合键值对的使用

5.1.1用复合键让系统完成排序

5.1.2把小的键值对合并成大的键值对

5.2用户定制数据类型

5.2.1 Hadoop内置的数据类型

5.2.2用户自定义数据类型的实现

5.3用户定制输入输出格式

5.3.1 Hadoop内置的文件输入格式和RecordReader

5.3.2用户自定义InputFormat和RecordReader示例

5.3.3 Hadoop内置的文件输出格式和RecordWriter

5.3.4用户自定义OutputFormat和RecordWriter示例

5.4用户定制Partitioner和Combiner

5.4.1用户定制Partitioner

5.4.2用户定制Combiner

5.5迭代完成MapReduce计算

5.5.1基本问题

5.5.2迭代MapReduce计算任务示例

5.6复合MapReduce计算过程的实现

5.6.1顺序化MapReduce任务的执行

5.6.2具有数据依赖关系的MapReduce任务的执行

5.6.3 MapReduce前处理和后处理步骤的链式执行

5.7多数据源的连接

5.7.1基本问题

5.7.2用DataJoin类实现Reduce端Join

5.7.3用文件复制方法实现Map端Join

5.7.4带Map端过滤的Reduce端Join

5.7.5多数据源连接解决方法的限制

5.8全局参数/数据文件的传递

5.8.1全局作业参数的传递

5.8.2全局数据文件的传递

5.9 关系数据库的连接与访问

5.9.1从数据库中输入数据

5.9.2向数据库中输出计算结果

5.10其它处理技术

5.10.1查询任务相关信息

5.10.2划分多个输出文件集合

第6章 Hive:飞进数据仓库的小蜜蜂

6.1 搭建蜂房——Hive安装

6.2 Hive的服务

6.3 HiveQL的使用

6.4 Hive示例

6.5 实战:?

第7章 Pig:一头什么都能吃的猪

7.1 Pig的安装

7.2 Pig Shell的使用

7.3 Pig Latin编程语言

7.4 Pig示例

7.5 实战:?

第8章 Cassandra:来自Facebook的女神

8.1 让Canssandra飞起来

8.2 洞察Cassandra的全貌

8.3 Cassandra与Hadoop联姻

8.4 Cassandra操作示例

8.5 实战:?

第9章 Chukwa:收集数据的大乌龟

9.1 Chukwa安装与配置

9.2 Chukwa的设计

9.3 Chukwa实践之路

9.4 实战:?

第10章 动物管理员ZooKeeper

10.1 谁动了ZK的钥匙

10.2 ZK是个谜

10.3 何去何从的ZK

10.4 ZooKeeper演练

10.5 实战:?

第11章 综合实战:打造一个搜索引擎

第12章 综合实战:生物信息学应用

第13章 综合实战:移动网络信令监测

第14章 高枕无忧:Hadoop容错

相关分词: 实战 Hadoop