数据仓库高级课程培训
数据仓库高级课程培训
课程大纲
内容
大纲
数据仓库和商业决策的关系
Ø 描述当今商业领域BI和数据仓库的角色
Ø 描述为什么在线联机系统(OLTP)不能满足决策支持
Ø 决策支持系统的数据抽取流程所带来的数据仓库技术
Ø 使用数据仓库技术的原因
Ø 如何使用数据仓库来加速商业决策和提高决策的质量
Ø OLAP主要的分析方法
数据仓库的概念和术语
Ø 通用的,被广泛接受的数据仓库定义
Ø 独立和非独立的数据集市的不同,适用范围
Ø 数据仓库开发的一些主要方法,介绍一种常用的模型:螺旋模型方法。
设计,分析,和管理数据仓库项目
Ø 解释开发和实现数据仓库的财政目的
Ø 开发时间的控制。
Ø 概述数据仓库项目的关键任务
Ø 讨论商业和用户需求的收集
Ø 如何标识用户的主要业务,并在短时间实现这一主要业务。
Ø 性能优化并简略讲述
数据仓库建模
Ø 讨论数据仓库环境下的数据结构
Ø 讨论数据仓库的设计步骤:
Ø –定义商业模型
Ø –定义维度模型
Ø –定义物理模型
Ø –介绍星型模型,简介雪花模型和星座模型
构建数据仓库: 抽取数据简介
Ø 构建数据仓库的ETL (Extraction, Transformation, and Loading)概述
Ø ETL任务, 重点和代价
Ø 解释如何去检查数据源
Ø ETL流程解决方案
元数据简介
Ø 数据仓库元数据定义、类型以及在数据仓库环境中的角色
Ø 数据仓库元数据的类型
Ø 开发元数据的策略等
数据仓库基本概念介绍
Ø 数据仓库的基本元素
Ø 数据仓库的基本形式
Ø 数据仓库的特点
Ø 数据仓库的开发特性
Ø 数据仓库与决策支持系统
Ø 数据仓库与数据集市
定义数据仓库的商业和逻辑模型
Ø 讨论企业级的策略分析工作
Ø 定义商业模型的各个部分
Ø 讨论数据仓库中元数据所扮演的角色,及追踪元数据的方法
Ø 定义逻辑模型和实体关系模型
创建维模型
Ø 详细介绍星型模型
Ø 如何从商业应用中标识事实表和它们的属性(列)
Ø 如何从商业应用中标识维表和它们的属性(列)
Ø 讨论数据仓库中的层次
Ø 讨论数据仓库的分析方法
创建物理模型
Ø 如何将维模型转换成物理模型
Ø 讨论数据仓库对体系结构的需求
Ø 介绍各种硬件体系结构的优缺点
Ø 讨论数据仓库所需的数据库服务器特性
物理模型的存储
Ø 介绍数据仓库大小的测试技术和测试样品的选取
Ø 介绍数据仓库索引的类型和策略
Ø 讨论数据仓库的表空间特性和策略
Ø 讨论数据仓库中表和索引的分区方法
ETL策略
Ø 介绍在构建数据仓库过程中的ETL方法
Ø ETL的常见问题(数据质量与控制调度策略)
Ø 常用的ETL技术
数据仓库产品工具展现案例分析
Ø IBM /Oracle 解决方案分析
Ø 电信行业解决方案(数据仓库构建,结合实际省份的构建案例,介绍常用的技术、常见问题及解决方法、)
数据挖掘
Ø 定义、关系及目的
Ø 模型+算法
Ø 方法论
Ø 数据准备、分类、关联规则、知识类型、数据挖掘模型、数据挖掘过程、系统结构
数据仓库延伸知识
Ø 云计算
Ø 互联网BI
Ø 大数据