当前位置:艾威培训主页 > 云计算与大数据 > 其他云计算大数据分析培训课程 > 移动互联网时代的数据分析实战培训 >
移动互联网时代的数据分析实战培训
课程介绍:
课程特色:
1,以友盟和电信分析为案例背景2,完整讲解电信分析项目的每一个环节;
3,细致掌握Hive数据分析的技术核心;
4,掌握日志数据收集工具Flume
5,掌握数据分析协助工具Sqoop
课程对象:
数据分析爱好者软件工程师;
数据库开发人员;
网络后台开发人员;
运维人员;
学员基础:
了解Linux系统;了解网络;
了解Java;
课程时长:2天
课程方式:
课程大纲:
第1个主题:移动互联网下数据分析的经典案例---友盟(具备掌握Hadoop完整项目的分析、开发、部署的全过程的能力)
1,移动开发者的数据统计和分析共同选择---友盟;
2,应对每日PB级别数据分析背后的技术架构揭秘
3,移动互联时代面对大规模数据分析的经典技术架构:Hadoop +Hive
第2个主题:大数据时代的数据分析(彻底理解Hadoop)
1、 Hadoop为什么是云计算分布式大数据的事实开源标准软件框架?
2、Hadoop的具体是如何工作?
3、Hadoop的生态架构和每个模块具体的功能是什么?
4、Hadoop中如何使用Hive进行数据分析?
第3个主题:数据分析平台集群与管理(具备构建并驾驭Hive集群能力)
1、 Hadoop集群的搭建
2、 Hadoop集群的监控
3、 Hadoop集群的管理
4、 集群下运行MapReduce程序
5、 构建数据分析平台下的Hive环境
第4个主题:实战Hive(具备掌握Hive企业级开发和管理的能力)
1、 Hive架构剖析
2、 Hive在HDFS中存储实现
3、 使用MySQL作为Hive的Metastore
4、 内部表、分区表、外部表、桶表
5、 视图
6、 自定义Hive的函数
第5个主题:实战Sqoop(具备使用Sqoop自由转换传统关系型数据库和HDFS中数据的能力)
1、Sqoop架构
2、实战Sqoop把MySQL中的数据导入到HDFS中
3、实战Sqoop把HDFS中的数据导入到MySQL中
4、定义Sqoop任务
第6个主题:实战Flume(具备使用Flume收集和管理分布式日志的能力)
1、 Flume架构体系剖析
2、 Agent配置信息
3、 动态监控文件夹中文件的变化
4、 把数据导入到HDFS中
5、 实例监控文件夹文件的变化并把数据导入到HDFS中
第7个主题:移动互联网电信日志统计分析项目实现(具备掌握Hive进行数据项目的分析、开发、部署的全过程的能力)
通过电信商搜集用户接打电话、上网等产生的日志对用户的电话和网络行为进行分析和监控,具体实现使大家熟悉Hive大数据进行分析统计的全过程。
1,移动开发者的数据统计和分析共同选择---友盟;
2,应对每日PB级别数据分析背后的技术架构揭秘
3,移动互联时代面对大规模数据分析的经典技术架构:Hadoop +Hive
第2个主题:大数据时代的数据分析(彻底理解Hadoop)
1、 Hadoop为什么是云计算分布式大数据的事实开源标准软件框架?
2、Hadoop的具体是如何工作?
3、Hadoop的生态架构和每个模块具体的功能是什么?
4、Hadoop中如何使用Hive进行数据分析?
第3个主题:数据分析平台集群与管理(具备构建并驾驭Hive集群能力)
1、 Hadoop集群的搭建
2、 Hadoop集群的监控
3、 Hadoop集群的管理
4、 集群下运行MapReduce程序
5、 构建数据分析平台下的Hive环境
第4个主题:实战Hive(具备掌握Hive企业级开发和管理的能力)
1、 Hive架构剖析
2、 Hive在HDFS中存储实现
3、 使用MySQL作为Hive的Metastore
4、 内部表、分区表、外部表、桶表
5、 视图
6、 自定义Hive的函数
第5个主题:实战Sqoop(具备使用Sqoop自由转换传统关系型数据库和HDFS中数据的能力)
1、Sqoop架构
2、实战Sqoop把MySQL中的数据导入到HDFS中
3、实战Sqoop把HDFS中的数据导入到MySQL中
4、定义Sqoop任务
第6个主题:实战Flume(具备使用Flume收集和管理分布式日志的能力)
1、 Flume架构体系剖析
2、 Agent配置信息
3、 动态监控文件夹中文件的变化
4、 把数据导入到HDFS中
5、 实例监控文件夹文件的变化并把数据导入到HDFS中
第7个主题:移动互联网电信日志统计分析项目实现(具备掌握Hive进行数据项目的分析、开发、部署的全过程的能力)
通过电信商搜集用户接打电话、上网等产生的日志对用户的电话和网络行为进行分析和监控,具体实现使大家熟悉Hive大数据进行分析统计的全过程。