【课程目标】
自2019年,Python已经成为最受欢迎的语言,它简单易用、跨平台、功能强大、扩展性强,而且能够将其它语言编写的程序融合起来,实现无缝连接,号称是万能胶水语言。
本课程为Python语言基础学习,通过本课程的学习,达到如下目的:
1、掌握Python基本格式,以及常用的6种基本语句。
2、掌握常用的标准数据类型及处理
3、掌握Pandas常用的统计功能(函数和方法)
4、理解统计分析原理,掌握统计分析常用的分析方法
5、熟练掌握matplotlib模块,熟练画图函数
6、学会解读图形,形成业务结论和业务策略。
【授课时间】
2-3天时间
(要根据学员的实际情况调整重点内容及时间)
【授课对象】
所有零基础的偏业务的想入门的非技术人员。
【学员要求】
课程为实战课程,要求:
1、每个学员自备一台便携机(必须)。
2、便携机中事先安装好Python 3.9版本及以上。
注:讲师现场提供开源的安装程序、扩展库,以及现场分析的数据源。
【授课方式】
语言基础 +原理讲解 +案例演练 +开发实践+可视化呈现
采用互动式教学,围绕业务问题,展开数据分析过程,全过程演练操作,让学员在分析、分享、讲授、总结、自我实践过程中获得能力提升。
【课程大纲】
第一部分:Python语言基础
目的:搭建Python环境,掌握编程的基本语句,以及熟悉常用数据结构的操作
1、Python简介
2、Python环境搭建(课前完成)
3、基本格式
编码(utf-8)
注释(单引号、双引号、三引号)
缩进(缩进—代码块)
标识符命名规则
保留字和内置函数
书写格式(一行一句、一行多句、一句多行)
第二部分:Python基本语句
1、基本格式
编码(utf-8)
注释(单引号、双引号、三引号)
缩进(缩进—代码块)
标识符命名规则
保留字和内置函数
书写格式(一行一句、一行多句、一句多行)
2、基本语句(主要6种)
3、赋值语句
变量定义
赋值运算符
4、输出语句
print语句
自动换行,不换行输出
变量位置输出
格式化字符串输出
5、输入语句
input语句
6、判断语句
if-elif-else语句
比较运算符
成员运算符
布尔运算符
身份运算符
7、循环语句
遍历循环for-else
条件循环while-else
循环中断(break和continue)
8、异常语句
try-excep-else-finally
9、其它特殊语句
演练:访问文件/目录
第三部分:Python数据类型
1、Python对象识别
2、常用的六种标准数据类型
不可变类型(Number, String, Tuple)
可变类型(list, Dict, Set)
3、数字类型
四种常用数字类型(int, Boolean, float, complex)
数字格式化字符
常用的数字扩展库
运算符(算术运算符、位运算符)
4、字符串
字符串表示
字符串访问
字符串转义
字符串前缀
字符串操作
字符串格式化
5、列表
列表定义
列表访问
列表修改
列表操作
列表切片
6、元组
元组定义
元组访问
元组切片
7、字典
字典定义
字典访问
字典修改
字典操作
8、集合
集合定义
集合访问
集合修改
集合运算
9、日期时间
datetime, date, time, timedelt
日期格式化字符含义
第四部分:数据分析基础
1、数据分析三个阶段
现状分析
原因分析
预测分析
2、数据思维的三个环节
3、数据分析的六个步骤
步骤1:明确目的--理清思路
步骤2:数据收集—理清思路
步骤3:数据预处理—寻找答案
步骤4:数据分析--寻找答案
步骤5:数据展示--观点表达
步骤6:报表撰写--观点表达
演练:如何用搭建精准营销的数据分析框架
演练:如何搭建用户购买行为的数据分析框架
第五部分:数据操作基础
1、简化的Python操作过程
2、数据分析常用扩展包
Numpy数组处理支持
Pandas数据分析和探索工具
Matplotlib可视化工具库
3、数据集读写
读取文件(CSV、Excel)
数据集保存(CSV、Excel)
4、数据集结构
数据集基本属性
Index:位置索引、标签索引
Series:一维结构
Dataframe:二维结构
5、数据集基本操作
数据访问
字段类型
类型检查
类型转换
定义有序类别变量
排序
按值排序
按索引排序
数据筛选
数据修改
数据删除
演示:数据读取,访问,预处理,筛选
第六部分:统计分析方法篇
1、统计分析基础
统计分析的关键要素
统计分析三个步骤
2、六种统计操作
描述统计describe
分类计数value_counts
分段计数/分箱计数value_counts(bins)
分类汇总(groupby, count/sum/mean/…)
透视表(多维统计分析)pivot_table
按日期汇总resameple/to_period
案例实战:掌握常用的Python统计函数/方法
3、五种统计分析方法
对比分析法(不同用户的消费水平差异)
结构分析法(用户的学历结构、收入结构分析、动态结构分析)
分布分析法(用户的年龄分布、用户消费层次)
交叉分析法(产品偏好分析)
趋势分析法(销售淡旺季节、用户活跃时间)
案例实战:掌握常用的统计分析方法
第七部分:数据可视化
目的:掌握作图扩展库,实现数据可视化
1、中文显示的问题解决
2、了解图形元素及其函数
标题、坐标轴、刻度
数据标签、文本、注释
图例、网格线、边框
图片显示、保存
3、简单图形的画法
柱状图(简单/复式/堆积/堆积百分比柱状图)
直方图(分布分析,查看分布特征)
箱图(判断离群值)
饼图(结构分析)
折线图(趋势分析)
桑基图
…
演练:画图示例,封装成函数或模块
4、复杂图形的画法
多子图
多坐标系作图
多区域作图
第八部分:数据预处理
1、数据预处理四大任务
数据清洗
数据集成
样本处理
变量处理
2、数据集成
样本追加
变量合并
拼接
演练:样本追加与变量合并
3、数据清洗
四大异常数据
重复值检查与处理
无效值检查与处理
离群值检查与处理
缺失值检查与处理
演练:异常值查找、删除、填充
4、样本处理
5、变量处理
结束:课程总结与问题答疑。