云计算分布式大数据HBase开发培训

课程介绍:

HBase是云计算时代大数据技术的事实开源标准和技术,是和Google的Bigtable类似的技术,很多使用云计算技术的公司(尤其是搜索引擎公司和金融机构基于互联网公司)均会选在使用HBase技术,本课程从HBase集群的实际构建、HBase具体的开发实战、HBase的内部架构、HBase的运维管理以及HBase的优化等深入浅出的细致剖析,祝你轻松掌握HBase

课程特点:

1,HBase集群的实际构建;
2,HBase具体的开发实战;
3,HBase的架构揭秘和剖析
4,HBase集群的管理;
5,HBase性能优化

课程对象:

软件工程师;
数据库开发人员;
网络后台开发人员;
运维人员;

学员基础:

了解Linux系统;
了解网络;
了解Java;

课程时长:2天

课程方式:

传统的面对面授课方式。

 

课程大纲:

第1个主题:HBase搭建、配置、部署和操作
1、HBase安装及其文件系统操作
2、HBase不同的运行模式
3、HBase具体的配置
4、HBase的部署
5、集群操作

第2个主题:HBase的集群监控
1.Master、Region、RPC、JVM、info监控
2.Ganlia
3.JMX
4.Nagios

第3个主题:HBase&HDFS&MapReduce
1.分布式的HBase
2.HBase与MapReduce
3.HBase与HDFS

第4个主题:HBase中数据表设计最佳实践
1.表设计的一些策略
2.FamalyColumn最佳配置技巧
3.表设计的IO优化
4.数据的过滤

第5个主题:操作HBase
1.交互客户端:Java、REST、Thrift、Avro等
2.批处理客户端和Shell
3.Web端UI

第6个主题:HBase架构深度剖析
1.HBase中数据的是如何查找的
2.HBase中的数据是如何传输的
3.HBase中数据具体存储的实现
4.WAL机制以及实现
5.Region
6.复制

第7个主题:HBase高级进阶
1、高级模式、辅助索引、搜索集成
2、版本管理
3、事物
4、行键的高级设计

第8个主题:HBase集群高级管理
1、运维任务
2、数据任务:数据的导入导出等
3、集群共享
4、日志
5、故障处理

第9个主题:HBase性能优化
1、压缩
2、拆分和合并
3、负载均衡
4、负载测试
5、垃圾回收优化
6、缓存

第10个主题:Hadoop开发者之路
1.Hadoop技能模型
2.Hadoop开发者最佳学习路线和方式
3.Hadoop开发者最佳成长路线