陈老师:1415968548 郑老师:2735197625 乐老师:354331153
客服热线:
19941464235 / 19906632509 / 19906733890 / 19905812933(微信同号)

客服微信

CCA Hadoop管理员认证培训

学习人数:887 课程类型:认证培训 课时长度:4天/24 课时
立即咨询
课程介绍

Cloudera Apache Hadoop培训及认证帮助您进阶大数据知识及技能Cloudera大学为期4天的Hadoop管理员培训将帮助学员综合理解并全面掌握通过Cloudera Manager对Hadoop机群的运维管理,包括:安装,配置、负载平衡及性能调优等。通过该培训, Hadoop系统管理员将能准备好应对实际运维中遇到的挑战。


培训内容

通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:

Cloudera Manager管理机群的特性,譬如日志汇总、配置管理、报告、报警及服务管理。

YARN、 MapReduce、 Spark及HDFS的工作原理。

如何为你的机群选取合适的硬件和架构。

如何将Hadoop机群和企业已有的系统进行无缝集成。

如何使用Flume进行实时数据采集以及如何使用Sqoop在RDBMS和Hadoop机群之间进行数据导入导出。

如何配置公平调度器为Hadoop上的多用户提供服务级别保障。

产品环境中Hadoop机群的最佳运维实践Hadoop机群排错、诊断问题和性能调优。


培训对象及学员基础

“面向系统管理员和IT经理,需具备Linux经验,无需Apache Hadoop基础。


认证

“结束本课程培训后,我们建议学员准备并注册参加Cloudera认证CCA Administrator管理员考试( CCA131 )。

通过并获取该证书是向公司及客户证明个人在Hadoop领域的技术和专长的有力依据


课程目标
具备大数据高级运维工程师能力。
课程大纲
Day 1
第1课 Apache Hadoop 介绍
• Hadoop 动机
• 基本概念
• Hadoop 核心部件
第2课 Hadoop 机群安装
• 机群管理方案
• Cloudera Manager 特性
• Cloudera manager 安装
• Hadoop (CDH) 安装
Day 2
第3课 Hadoop 分布式文件系统 (HDFS)
• HDFS 特性
• 读写文件
• NameNode 内存考虑
• HDFS 安全简介
• HDFS Web UI
• 使用 HDFS Shell
第4课 YARN 上的 MapReduce 和 Spark
• 计算平台在 Hadoop 里扮演的角色
• YARN:机群资源管理器
• MapReduce 概念
• Apache Spark 概念
• Yarn 上的计算平台
• YARN Web UI 及 Shell
• YARN 应用运行日志
第5课 Hadoop 配置及服务运行日志
• Cloudera Manager 配置管理机制
• 定位配置参数及进行配置变更
• 管理角色实例及添加服务
• 配置 HDFS 服务
• 配置 Hadoop 服务运行日志
• 配置 YARN 服务
第6课 向 HDFS 导入数据
• 使用 Flume 从外部数据源实时导入数据
• 使用 Sqoop 从关系数据库导入数据
• REST 接口
• 导入数据的最佳实践
Day 3
第7课 Hadoop 机群规划
• 规划考虑因素
• 硬件选择
• 虚拟化选项
• 网络因素 • 节点配置
第8课 Hive,Impala 及 Pig 的安装及配置
• Hive
• Impala
• Pig
第9课 Hadoop 客户端及Hue
• 什么是 Hadoop 客户端
• 安装及配置 Hadoop 客户端
• 安装及配置 Hue
• 使用 Hue 进行身份验证及授权
第10课 集群高级配置
• 高级配置参数
• Hadoop 端口配置
• HDFS 机柜感知配置
• HDFS 高可靠性配置
Day 4
第11课 Hadoop 安全
• Hadoop 安全的重要性
• Hadoop 安全性概念
• Kerberos 简介
• 使用 Kerberos 保护Hadoop机群
• 其他安全特性
第12课 资源管理
• 使用静态服务池配置 Linux cgroup
• 公平调度器 • 配置动态资源池
• YARN 内存及 CPU 设置
• Impala 查询调度
第13课 机群维护
• 检查 HDFS 状态
• 机群间复制数据
• 添加/移除机群节点
• 机群数据负载平衡
• 目录快照 • 机群升级
第14课 机群监控及排错
• Cloudera Manager 监控特性
• 监控 Hadoop 机群
• Hadoop 机群排错
• 常见配置不当问题
讲师信息

郭一军

云贝教育创始人  腾讯云TVP  PostgreSQL ACE总监

腾讯云TDSQL首席讲师,ITPUB论坛社区资深版主,有丰富的IT领域知识经验。阿里云官方授权讲师,腾讯云官方授权讲师,Oracle 官方授权讲师,中国PostgreSQL分会官方授权讲师,北京吉利大学企业导师。历任过连连支付首席DBA、唯品会高级数据库专家、吉利汽车研究院云计算平台技术负责人。负责连连支付核心交易库的开发与运维、经历唯品会大规模(5000+个实例)MySQL数据库的架构设计和运维,主导吉利汽车上亿级的私有云项目及智能驾驶200Pb数据存储架构设计。有10+年的数据库授课经验,曾给中国人民银行、中国银行、中国农行、中国建行、中国银联、中国邮政、平安银行、招商银行、上海银行、上海农商行、昆山农商行、重庆农商行、浙农信、兴业银行、菲律宾银行、浦发硅谷银行、秦皇岛银行、湖州银行、东莞银行、海峡银行、中泰证券、太平洋保险、太平保险等企业开展内训。后来创建云贝教育,言传身教,亲自讲授云计算、大数据、数据库等方面的几十门课程。为中国IT业特别是数据库行业输送了大量人才,引领无数弟子进入业界,广受尊重。
推荐课程

CCA Spark和Hdoop开发员认证培训

CCA数据分析师认证培训

Apache HBase认证培训

CCP数据工程师认证培训