班级规模及环境--热线:4008699035 手机:15921673576( 微信同号) |
每期人数限3到5人。 |
上课时间和地点 |
上课地点:【上海】:同济大学(沪西)/新城金郡商务楼(11号线白银路站) 【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院 【北京分部】:北京中山学院/福鑫大楼 【南京分部】:金港大厦(和燕路) 【武汉分部】:佳源大厦(高新二路) 【成都分部】:领馆区1号(中和大道) 【沈阳分部】:沈阳理工大学/六宅臻品 【郑州分部】:郑州大学/锦华大厦 【石家庄分部】:河北科技大学/瑞景大厦 【广州分部】:广粮大厦 【西安分部】:协同大厦
最近开课时间(周末班/连续班/晚班):2020年3月16日 |
实验设备 |
☆资深工程师授课
☆注重质量
☆边讲边练
☆合格学员免费推荐工作
★实验设备请点击这儿查看★ |
质量保障 |
1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
2、培训结束后,授课老师留给学员联系方式,保障培训效果,免费提供课后技术支持。
3、培训合格学员可享受免费推荐就业机会。 |
课程大纲 |
培训模块 内容
大数据应用背景、技术简介、以及行业案例 1. 大数据基本概念、技术梗概、技术沿革,以及大数据技术是如何改变人工智能技术、语音识别技术、图像识别/视频理解、自然语言处理技术等;
2. 大数据在政府、金融、石油、教育、交通、医疗卫生等行业的成功案例,以及如何利用大数据挖掘潜在的商业价值,并改变这些行业应用使之提高智能化水准,更好地支持用户的个性化服务。
常见的传统数据分析平台和流的大数据分析平台介绍 1. 分类介绍常见的传统数据分析平台和新兴的大数据分析处理平台,它们各自的技术特色以及发挥其性能优势的最佳应用场景;
2. 目前主流的新兴大数据平台—Hadoop简介,以及在大数据存储、管理、计算处理方面的优势;
3. Hadoop生态系统平台介绍,以及它们在大数据离线分析、近线分析、实时在线分析处理方面的优化组合方案和性能优势。
大数据文件存储系统技术和分布式文件系统平台及其应用 1. 分布式文件系统HDFS概述、功能、作用、优势、应用范畴、应用现状和发展趋势;
2. HDFS分布式文件系统核心关键技术、设计精髓、基本工作原理、系统架构、文件存储模式、工作机制、存储扩容与吞吐性能扩展。
大数据分布式处理与数据并行分析计算技术实现以及平台应用 1. 并行计算与函数式编程技术概述,MapReduce工作机制、技术原理和处理架构;
2. 常见的Hadoop故障错误分析策略以及监控工具详解,云文件存储系统状态以及海量作业执行状态监控与故障解决经验介绍。
大规模非结构化数据管理技术实现与平台应用 1. SQL、NoSQL和NewSQL关键技术详解,系统平台概述与分类比较,以及应用场景;
2. HBase半结构化数据管理平台工作原理、技术架构、数据交互,HMaster和HRegionServer工作流程以及常用客户端操作;
3. HBase半结构化大数据管理集群管理、运维监控、性能优化、负载均衡,以及与Hadoop核心组件HDFS和MapReduce的数据协同操作应用。
大数据仓库离线分析处理技术实现与平台应用 1. Hive数据仓库的基本原理、核心技术、系统架构详解,以及在大数据离线分析中的应用场景;
2. Hive数据类型、HQL语法详解、Hive文件与记录存储格式、Hive与HBase数据库整合、Hive大数据统计分析技术、Hive功能操作实践。
大数据分析挖掘算法、工具以及平台应用 1. 数据挖掘技术发展历程,大数据时代下的数据挖掘技术发展趋势,以及10大数据挖掘算法简介;
2. 基于MapReduce的数据挖掘算法库在巨量日志分析、个性化推荐分析、高端制造业、生物医疗、建筑业、多媒体信息融合、GIS空间应用、营销广告、社交媒体分析等领域中的项目应用与关键技术实现介绍;
3. 基于MapReduce的数据挖掘算法实现,以及Mahout机器学习与大数据挖掘平台的工作原理、技术架构、功能实现以及工具包的使用介绍。
数据源、数据流收集与实时采集技术 1. 实时日志采集与数据收集技术,以及Flume & Flume-NG日志采集系统的原理、架构分析与应用介绍;
2. Scribe系统数据采集的原理、架构分析与应用介绍;
3. 大数据可视化技术实现、以及工具应用介绍; |
|
|
|