移动互联网时代的数据分析实战培训

课程介绍:

移动互联网时代的数据分析面临前所未有的问题和挑战,数据格式的多样性和数据量的爆炸性增长导致了数据分析手段的革命,何以解忧?从友盟的技术架构中我们会找到移动互联网时代数据分析解决方案的经典答案:Hadoop+Hive。
课程我们以移动互联网电信数据分析案例为背景,深入浅出的剖析数据分析需要使用的技术、实施方案、实施过程和最后的分析代码的编写等全过程,理论和实际相结合,祝您轻松驾驭移动互联网时代的海量数据的分析问题。

课程特色:

1,以友盟和电信分析为案例背景
2,完整讲解电信分析项目的每一个环节;
3,细致掌握Hive数据分析的技术核心;
4,掌握日志数据收集工具Flume
5,掌握数据分析协助工具Sqoop

课程对象:

数据分析爱好者
软件工程师;
数据库开发人员;
网络后台开发人员;
运维人员;

学员基础:

了解Linux系统;
了解网络;
了解Java;

课程时长:2天

课程方式:

传统的面对面授课方式。

 

课程大纲:

第1个主题:移动互联网下数据分析的经典案例---友盟(具备掌握Hadoop完整项目的分析、开发、部署的全过程的能力)
1,移动开发者的数据统计和分析共同选择---友盟;
2,应对每日PB级别数据分析背后的技术架构揭秘
3,移动互联时代面对大规模数据分析的经典技术架构:Hadoop +Hive

第2个主题:大数据时代的数据分析(彻底理解Hadoop)
1、 Hadoop为什么是云计算分布式大数据的事实开源标准软件框架?
2、Hadoop的具体是如何工作?
3、Hadoop的生态架构和每个模块具体的功能是什么?
4、Hadoop中如何使用Hive进行数据分析?

第3个主题:数据分析平台集群与管理(具备构建并驾驭Hive集群能力)
1、 Hadoop集群的搭建
2、 Hadoop集群的监控
3、 Hadoop集群的管理
4、 集群下运行MapReduce程序
5、 构建数据分析平台下的Hive环境

第4个主题:实战Hive(具备掌握Hive企业级开发和管理的能力)
1、 Hive架构剖析
2、 Hive在HDFS中存储实现
3、 使用MySQL作为Hive的Metastore
4、 内部表、分区表、外部表、桶表
5、 视图
6、 自定义Hive的函数

第5个主题:实战Sqoop(具备使用Sqoop自由转换传统关系型数据库和HDFS中数据的能力)
1、Sqoop架构
2、实战Sqoop把MySQL中的数据导入到HDFS中
3、实战Sqoop把HDFS中的数据导入到MySQL中
4、定义Sqoop任务

第6个主题:实战Flume(具备使用Flume收集和管理分布式日志的能力)
1、 Flume架构体系剖析
2、 Agent配置信息
3、 动态监控文件夹中文件的变化
4、 把数据导入到HDFS中
5、 实例监控文件夹文件的变化并把数据导入到HDFS中

第7个主题:移动互联网电信日志统计分析项目实现(具备掌握Hive进行数据项目的分析、开发、部署的全过程的能力)
通过电信商搜集用户接打电话、上网等产生的日志对用户的电话和网络行为进行分析和监控,具体实现使大家熟悉Hive大数据进行分析统计的全过程。