SQL 数据查询¶
为什么 SQL 是数据分析师的第一语言
SQL 是与数据库对话的通用语言——超过 90% 的数据分析岗位将其列为必备技能。无论是日常取数、报表统计,还是用户行为分析和漏斗建模,SQL 都是你最直接、最高效的工具。
📚 学习模块导航¶
本专区按照 "基础语法 → 高级技巧 → 实战项目" 的路径组织内容,建议按顺序推进。
-
MySQL 核心教程
从零开始系统学习 MySQL,涵盖 基础篇 与 进阶篇,全程配有代码实操、图表与思维导图。
- ✨ 基础篇:DDL/DML/DQL、多表查询、事务控制
- 🔎 进阶篇:索引优化、SQL 调优、视图与锁机制
- 🎯 附数据分析师章节筛选建议,避免无效学习
-
SQL 窗口函数专题
窗口函数是数据分析师与 SQL 工程师的分水岭技能,专项攻克排名、同比环比、滑动平均等难点。
- 📊 基础篇:
ROW_NUMBER/RANK/LEAD/LAG - 🖼️ 进阶篇:帧子句
ROWSvsRANGE、NTILE、CUME_DIST - ⚡ 配有完整测试数据与易错点汇总
- 📊 基础篇:
-
实战:淘宝用户行为分析
基于 1 亿行 阿里云天池 UserBehavior 数据集,完整走通数据导入、清洗、分析与可视化全链路。
- 🗄️ 亿级数据导入方案(Kettle /
LOAD DATA INFILE) - 📈 转化漏斗、RFM 用户分层、热门品类分析
- 💡 附小样本验证策略与新手上路建议
- 🗄️ 亿级数据导入方案(Kettle /
🧠 知识图谱¶
graph LR
Root["SQL 学习体系"] --> MySQL["MySQL 核心教程"]
Root --> WinFunc["窗口函数专题"]
Root --> Project["淘宝实战项目"]
MySQL --> Basic["基础篇"]
MySQL --> Adv["进阶篇"]
Basic --> CRUD["DDL / DML / DQL"]
Basic --> MultiJoin["多表查询"]
Basic --> Txn["事务控制"]
Adv --> Idx["索引优化"]
Adv --> Perf["SQL 调优"]
Adv --> View["视图 & 存储过程"]
Adv --> Lock["锁机制"]
WinFunc --> Rank["排名函数"]
WinFunc --> Offset["位移函数"]
WinFunc --> Frame["帧子句"]
WinFunc --> Dist["分布函数"]
Project --> Import["亿级数据导入"]
Project --> Clean["数据清洗"]
Project --> Analysis["行为分析 & 漏斗"]
Project --> RFM["RFM 用户分层"]
style Root fill:#dcd2ff,stroke:#4f2ea7,stroke-width:2px,color:#24124b
style MySQL fill:#00bcd4,stroke:#fff,color:#fff
style WinFunc fill:#ffd6e5,stroke:#a82757,stroke-width:2px,color:#4a1028
style Project fill:#ff9800,stroke:#fff,color:#fff
图谱从 SQL 学习体系出发,分为 MySQL 核心教程、窗口函数专题与淘宝实战项目。MySQL 路径继续细分为基础篇与进阶篇,窗口函数覆盖排名、位移、帧子句和分布函数,实战项目覆盖导入、清洗、行为分析和 RFM 分层。
🎯 数据分析师学习优先级¶
聚焦原则
MySQL 体系庞大(含 DBA 运维内容),数据分析师应遵循 "去肥增瘦" 原则,把时间花在取数效率和分析能力上。
| 模块 | 优先级 | 核心理由 |
|---|---|---|
| DQL 查询 & 多表连接 | ⭐⭐⭐ 必学 | 日常取数的基石,面试必考 |
| 索引 & SQL 优化 | ⭐⭐⭐ 必学 | 千万级数据不懂索引 = 查询超时,掌握 EXPLAIN 是分水岭 |
| 窗口函数 | ⭐⭐⭐ 必学 | 排名、同比环比、留存分析的利器,面试高频考点 |
| 实战项目 | ⭐⭐⭐ 必做 | 打通"导入 → 清洗 → 分析 → 可视化"全链路,简历加分项 |
| 视图 | ⭐⭐ 推荐 | 封装复杂分析逻辑(如留存率计算),方便复用 |
| 存储过程 & 触发器 | ⭐ 选学 | 现代架构多用 Python/Airflow 做 ETL,读懂即可 |
| 运维篇 | ❌ 跳过 | 主从复制、分库分表由 DBA 负责 |
📊 内容规模一览¶
| 模块 | 文档数 | 核心知识点 |
|---|---|---|
| MySQL 核心教程 | 4 篇 | DDL/DML/DQL、多表查询、事务、索引、SQL 优化、视图、锁 |
| 窗口函数专题 | 2 篇 | 排名/位移/聚合窗口、帧子句、分布函数、WINDOW 子句复用 |
| 淘宝实战项目 | 3 篇 | 亿级导入、数据清洗、漏斗分析、RFM 分层、热门商品分析 |
🔗 延伸资源¶
-
在线练习平台
- SQLZoo — 交互式 SQL 教程
- LeetCode Database — SQL 面试题库
- HackerRank SQL — 分难度刷题
-
推荐学习资料
- MySQL 8.0 官方文档 — 权威参考
- SQL Style Guide — SQL 编码规范
- Use The Index, Luke — 索引优化圣经
学习建议
实践优先:每学完一个章节,务必在本地 MySQL 环境中亲自执行 SQL。对于 EXPLAIN 执行计划,尝试对比加索引前后的查询行数差异,会有醍醐灌顶的体验。