← 返回首页
📊

数据分析技术

掌握数据分析的核心方法与工具,从数据中挖掘价值,为商业决策提供数据支持

📅
开设学期
大二第二学期
⏱️
课时
64 课时
🎯
课程类型
专业核心课
🔧
核心工具
Pandas / Matplotlib / Seaborn
🎓 莫梓祺的学习网站

点击进入 · 10个实战项目 · 在线运行代码 · 无需安装

📚 课程大纲

共 8 章 · 理论 + 工具 + 实战

1 数据分析概述

了解数据分析的定义、发展历程与应用领域。认识数据分析的完整流程,建立数据思维。

  • 数据分析的定义与价值
  • 数据分析流程:需求分析 → 数据获取 → 数据清洗 → 分析建模 → 可视化 → 报告
  • 数据分析的应用领域:电商、金融、医疗、零售、供应链
  • 数据分析师的能力模型与职业发展路径
  • 常用工具概览:Excel、Python、SQL、Tableau、Power BI
2 NumPy数值计算基础

学习NumPy库的核心功能,掌握多维数组的创建、运算与操作,为Pandas学习打下基础。

  • NumPy简介与安装
  • ndarray数组:创建、属性(shape、dtype、ndim)
  • 数组索引与切片
  • 数组运算:广播机制、通用函数(ufunc)
  • 常用函数:sum()、mean()、std()、argmax()、sort()
  • 实战:使用NumPy进行简单数据统计分析
3 Pandas数据处理核心

深入学习Pandas库,掌握Series和DataFrame的核心操作,实现高效的数据读取、筛选、处理。

  • Series与DataFrame:创建、属性、索引操作
  • 数据读取:read_csv()、read_excel()、read_json()、read_sql()
  • 数据筛选:loc[]、iloc[]、条件筛选、isin()
  • 数据排序:sort_values()、sort_index()
  • 数据统计:describe()、value_counts()、groupby()
  • 实战:读取超市销售数据并进行基础统计分析
4 数据清洗与预处理

学习如何处理真实数据中的质量问题,包括缺失值、异常值、重复值,以及数据标准化方法。

  • 缺失值处理:isnull()、dropna()、fillna()
  • 异常值检测:箱线图法、Z-score法、IQR法
  • 重复值处理:duplicated()、drop_duplicates()
  • 数据类型转换:astype()、pd.to_datetime()
  • 数据标准化:Min-Max归一化、Z-Score标准化
  • 实战:清洗某电商订单数据集
5 探索性数据分析(EDA)

掌握描述性统计方法与探索性分析技巧,能够对数据进行系统性的初步分析。

  • 描述性统计:集中趋势(均值、中位数、众数)、离散程度(方差、标准差)
  • 分布分析:偏度、峰度、正态分布检验
  • 相关性分析:corr()、相关系数矩阵
  • 分组分析:groupby() + agg() 多函数聚合
  • 交叉分析:pivot_table()、crosstab()
  • 实战:某连锁超市销售数据EDA报告
6 数据可视化基础

学习使用Matplotlib和Seaborn进行数据可视化,掌握常见图表的绘制方法与选择逻辑。

  • Matplotlib基础:figure、axes、子图
  • 常见图表:折线图、柱状图、散点图、饼图、直方图、箱线图
  • 图表美化:标题、标签、图例、颜色、样式
  • Seaborn高级绘图:heatmap、pairplot、violinplot
  • 图表选择原则:对比→柱状图、趋势→折线图、分布→直方图、相关→散点图
  • 实战:绘制销售数据分析可视化报告
7 时间序列分析基础

学习时间序列数据的处理方法,掌握日期时间操作、重采样、滚动窗口等常用技术。

  • 时间序列数据特点与常见场景
  • Pandas时间处理:to_datetime()、dt访问器
  • 时间索引与切片
  • 重采样:resample() 按日/周/月聚合
  • 滚动窗口:rolling() 移动平均、移动标准差
  • 实战:分析某股票/商品的历史价格走势
8 综合实战:销售数据分析项目

综合运用所学知识,完成一个完整的销售数据分析项目,从数据读取到报告输出全流程实践。

  • 项目背景:某零售企业年度销售数据分析
  • 数据读取与初步探索
  • 数据清洗:缺失值、异常值、重复值处理
  • 业务分析:销售额趋势、品类分析、客户分析、RFM模型
  • 可视化报告:多图表组合、仪表盘设计
  • 分析结论与业务建议