员工培训网-企业培训首选服务平台!
孙增辉

Spark数据分析

孙增辉:ISO体系培训讲师
ISO体系 大数据 云计算
常驻城市:北京 课酬费用:面议

课程大纲

1) Spark数据分析
课程介绍
本课程将关注spark的数据分析技术实际应用。
课程目标
l数据分析
培训对象
开发人员
课程长度
5天(30学时)
培训方式
案例分析、情景演练
课程内容

第1天

主题

Spark 的环境搭建与运行
大纲
Spark 的本地安装与配置
Spark 集群
Spark 编程模型

主题

数据分析系统商业案例
大纲
个性化
目标营销和客户细分
预测建模与分析
机器学习的系统架构

第2天

主题

Spark 上数据的获取、处理与准备
大纲
获取公开数据集
处理与转换数据
从数据中提取有用特征
主题
构建基于Spark 的推荐引擎
大纲
推荐模型的分类
提取有效特征
训练推荐模型
使用推荐模型
推荐模型效果的评估.

第3天

主题
Spark构建分类模型
大纲
分类模型的种类
从数据中抽取合适的特征
训练分类模型
使用分类模型
评估分类模型的性
改进模型性能以及参数调优.
主题
Spark构建回归模型
大纲
回归模型的种类
从数据中抽取合适的特征
回归模型的训练和应用
评估回归模型的性能
改进模型性能和参数调优.

第4天

主题
Spark构建聚类模型
大纲
聚类模型的类型
从数据中提取正确的特征
训练聚类模型
使用聚类模型进行预测
评估聚类模型的性能
主题
Spark应用于数据降维
大纲
降维方法的种类
从数据中抽取合适的特征
训练降维模型
使用降维模型
第5天
主题
Spark高级文本处理技术
大纲
处理文本数据有什么特别之处
从数据中抽取合适的特征
评估文本处理技术的作用
主题
SparkStreaming 在实时机器学习上的应用
大纲
在线学习.
流处理.
使用Spark Streaming 进行在线学习

孙增辉的其他课程

课程时长:2天
课程时长:2天
课程时长:2天
课程时长:2天
课程时长:2天
课程时长:2天
课程时长:2天
课程时长:2天
课程时长:2天
课程时长:2天
课程时长:2天
课程时长:2天
课程时长:2天
有需求找员培
-- 1000+实战师资团队 --
极速匹配师资,定制方案
ISO体系相关培训师
ISO体系相关内训课
ISO体系相关公开课

讲师内训服务流程

1
匹配师资
根据企业需求匹配最佳讲师课程
2
课前沟通
安排讲师与企业负责人课前充分沟通
3
确定课程
讲师根据课前调研确定大纲并经企业确认
4
制作物料
我方打印课程讲义、桌牌等课程所需物料
5
讲师授课
安排讲师到场授课,企业组织学员参加
6
课后服务
课后回访学习情况并持续服务
邀请孙增辉老师内训
下载课程大纲
提交成功,我们会尽快联系您!