- 数据分析的完整步骤
- 提出问题
- 理解数据
- 数据清洗
数据重复【删除重复项】
数据抽取【left,right,mid】
数据计算【average、sum、max、min、date、if、or、countif】
- 构建模型
分组汇总【数据透视表】
描述统计分析【分析工具库】
多表关联查询【vlookup】
- 数据可视化
- 提出问题
- 处理数据时注意保留原数据不被更改(在副本上进行修改)单元格格式默认为“常规”,表示Excel会自动根据文本的类型选择对应的格式
- 小技巧:如何快速判断文本为数字类型还是字符串类型?
- 字符串类型:左对齐
- 数字类型:右对齐
- 理解数据
- 第二关的内容
通过设置自动换行,和将列宽统一设置成15,可以使数字更加直观
excel中的数据类型大概可以分成上表中的三种,其中字符串类型和数值类型的区别如下
- 数据清洗
- 清洗的步骤
- 选择子集
- 列名重命名(改成自己熟悉的名字)
- 删除重复值
- 缺失值处理
- 一致性处理
- 数据排序异常值处理
- 选择子集(列隐藏功能)
- 列隐藏功能:右键——隐藏,可以隐藏数列,如何恢复显示?选中整个表格——“开始”选项卡——“格式“——”隐藏与取消隐藏“——取消隐藏行或列