班级规模及环境--热线:4008699035 手机:15921673576( 微信同号) |
每期人数限3到5人。 |
上课时间和地点 |
开课地址:【上海】同济大学(沪西)/新城金郡商务楼(11号线白银路站)【深圳分部】:电影大厦(地铁一号线大剧院站) 【武汉分部】:佳源大厦【成都分部】:领馆区1号【沈阳分部】:沈阳理工大学【郑州分部】:锦华大厦【石家庄分部】:瑞景大厦【北京分部】:北京中山学院 【南京分部】:金港大厦
最新开班 (连续班 、周末班、晚班):2020年3月16日 |
实验设备 |
☆资深工程师授课
☆注重质量
☆边讲边练
☆合格学员免费推荐工作
★实验设备请点击这儿查看★ |
质量保障 |
1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
2、培训结束后,授课老师留给学员联系方式,保障培训效果,免费提供课后技术支持。
3、培训合格学员可享受免费推荐就业机会。 |
课程大纲 |
|
课程目标
掌握Python数据挖掘流程,熟练使用Python库进行建模分析。
适用人群
熟悉Python准备从事数据领域的同学们
课程简介
Python数据挖掘系列课程基于真实数据集进行案例实战,使用Python数据科学库从数据预处理开始一步步进行数据建模。对于每个案例首先进行流程解读与数据分析,建立特征工程,详细解读其中每一步原理与应用
第1章泰坦尼克号获救预测
1-1数据挖掘任务流程
1-2数据介绍
1-3Python兵器库介绍
1-4sklearn库介绍
1-5数据读取与统计分析
1-6性别特征分析
1-7船舱等级特征分析
1-8缺失值问题
1-9年龄缺失值填充与分析
1-10登船地点特征分析
1-11家庭特征分析
1-12特征相关性
1-13构建特征
1-14机器学习算法概述
1-15交叉验证
1-16多种机器学习算法模型效果
1-17集成模块
1-18特征重要性衡量
1-19总结与特征预处理
第2章用户画像
2-1用户画像概述
2-2如何建立用户画像
2-3用户搜索数据介绍
2-4任务概述与方案
2-5构造词向量特征
2-6构造输入特征
2-7建立预测模型
第3章Xgboost实战
3-1Xgboost算法概述
3-2Xgboost模型构造
3-3Xgboost建模衡量标准
3-4Xgboost安装
3-5保险赔偿任务概述
3-6Xgboost参数定义
3-7基础模型定义
3-8树结构对结果的影响
3-9学习率与采样对结果的影响
第4章用电敏感客户分类
4-1任务概述与解决框架
4-2特征工程分析与特征提取
4-3离散数据处理
4-4统计与文本特征
4-5文本特征构建
4-6构建低敏用户模型
4-7高敏模型概述
第5章BenchMark与论文的作用
5-1HTTP检测任务与数据挖掘的核心
5-2论文的重要程度
5-3BenchMark概述
5-4BenchMark的作用
第6章京东购买意向预测
6-1项目与数据介绍
6-2数据挖掘流程
6-3数据检查
6-4构建用户特征表单
6-5构建商品特征表单
6-6数据探索概述
6-7购买因素分析
6-8特征工程
6-9基本特征构造
6-10行为特征
6-11累计行为特征
6-12Xgboost模型
第7章kaggle数据科学调查
7-1kaggle数据科学调查介绍
7-2基本情况可视化展
7-3工资情况
7-4技能使用情况
7-5数据集与平台
7-6Python与R哪家强
7-7调查总结
第8章房价预测
8-1房价预测任务概述
8-2离散型数据
8-3数据对数变换
8-4缺失值处理与box-cox变换
8-5模型预测
第9章fbprophet时间序列预测
9-1fbprophet股价预测任务概述
9-2时间序列分析
9-3fbprophet时间序列预测实例
9-4亚马逊股价趋势
9-5突变点调参
|