课程培训
大数据分析培训

 培训对象:需要使用Hadoop来进行数据分析的数据分析员,商业分析

教学大纲:

Hadoop基础

Pig基础

使用Pig进行简单数据分析

使用Pig处理复杂数据

使用Pig分析处理多数据集

Pig排错和优化

Hive与Impala基础

使用Hive与Impala进行数据分析

数据管理

数据存储与性能

使用Hive与Impala进行数据分析

Impala如何执行查询/扩展及改善性能

使用Hive分析处理文本数据

Hive优化

扩展Hive

如何选取数据分析工具

 

课程大纲:

Hadoop Fundamentals 

 The Motivation for Hadoop 

 

      Hadoop Overview 

 

      Data Storage: HDFS 

 

      Distributed Data Processing: YARN, MapReduce, and Spark 

 

      Data Processing and Analysis: Pig, Hive, and Impala 

 

      Data Integration: Sqoop 

 

      Other Hadoop Data Tools 

 

      Exercise Scenarios Explanation 

 

 

 

Introduction to Pig 

 

      What Is Pig? 

 

      Pig’s Features 

 

      Pig Use Cases 

 

      Interacting with Pig 

 

Basic Data Analysis with Pig 

 

      Pig Latin Syntax 

 

      Loading Data 

 

      Simple Data Types 

 

      Field Definitions 

 

      Data Output 

 

      Viewing the Schema 

 

      Filtering and Sorting Data 

 

      Commonly-Used Functions 

 

Processing Complex Data with Pig 

 

      S torage Formats 

 

      Complex/Nested Data Types 

 

      G rouping 

 

      Built-In Functions for Complex Data 

 

      Iterating Grouped Data 

 

Multi-Dataset Operations with Pig 

 

      Techniques for Combining Data Sets 

 

      Joining Data Sets in Pig 

 

      Set Operations 

 

      Splitting Data Sets 

 

Pig Troubleshooting and Optimization 

 

      Troubleshooting Pig 

 

      Logging 

 

      Using Hadoop’s Web UI 

 

      Data Sampling and Debugging 

 

      Performance Overview 




如果您想学习本课程,请预约报名
如果没找到合适的课程或有特殊培训需求,请订制培训
培训特点:
针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示
培训讲师:
中国科学院软件研究所,计算研究所高级研究人员
IBM,oracle,微软,vmware等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享。
针对客户实际需求,案例教学,互动式沟通,学有所获
报名表下载
联系我们 更多>>

 电话咨询:010-62883247

                 010-62884854

 电子邮件: soft@info-soft.cn 

 

点击这里给我发消息

点击这里给我发消息

点击这里给我发消息

qrcode_for_gh_98c3580f6c5a_430.jpg

订制培训 更多>>