跳转至

SQL 数据查询

为什么 SQL 是数据分析师的第一语言

SQL 是与数据库对话的通用语言——超过 90% 的数据分析岗位将其列为必备技能。无论是日常取数、报表统计,还是用户行为分析和漏斗建模,SQL 都是你最直接、最高效的工具。


📚 学习模块导航

本专区按照 "基础语法 → 高级技巧 → 实战项目" 的路径组织内容,建议按顺序推进。

  • MySQL 核心教程


    从零开始系统学习 MySQL,涵盖 基础篇进阶篇,全程配有代码实操、图表与思维导图。

    • 基础篇:DDL/DML/DQL、多表查询、事务控制
    • 🔎 进阶篇:索引优化、SQL 调优、视图与锁机制
    • 🎯 附数据分析师章节筛选建议,避免无效学习

    进入 MySQL 核心教程

  • SQL 窗口函数专题


    窗口函数是数据分析师与 SQL 工程师的分水岭技能,专项攻克排名、同比环比、滑动平均等难点。

    • 📊 基础篇ROW_NUMBER / RANK / LEAD / LAG
    • 🖼️ 进阶篇:帧子句 ROWS vs RANGENTILECUME_DIST
    • ⚡ 配有完整测试数据与易错点汇总

    进入窗口函数专题

  • 实战:淘宝用户行为分析


    基于 1 亿行 阿里云天池 UserBehavior 数据集,完整走通数据导入、清洗、分析与可视化全链路。

    • 🗄️ 亿级数据导入方案(Kettle / LOAD DATA INFILE
    • 📈 转化漏斗、RFM 用户分层、热门品类分析
    • 💡 附小样本验证策略与新手上路建议

    进入淘宝实战项目


🧠 知识图谱

graph LR
    Root["SQL 学习体系"] --> MySQL["MySQL 核心教程"]
    Root --> WinFunc["窗口函数专题"]
    Root --> Project["淘宝实战项目"]

    MySQL --> Basic["基础篇"]
    MySQL --> Adv["进阶篇"]

    Basic --> CRUD["DDL / DML / DQL"]
    Basic --> MultiJoin["多表查询"]
    Basic --> Txn["事务控制"]

    Adv --> Idx["索引优化"]
    Adv --> Perf["SQL 调优"]
    Adv --> View["视图 & 存储过程"]
    Adv --> Lock["锁机制"]

    WinFunc --> Rank["排名函数"]
    WinFunc --> Offset["位移函数"]
    WinFunc --> Frame["帧子句"]
    WinFunc --> Dist["分布函数"]

    Project --> Import["亿级数据导入"]
    Project --> Clean["数据清洗"]
    Project --> Analysis["行为分析 & 漏斗"]
    Project --> RFM["RFM 用户分层"]

    style Root fill:#dcd2ff,stroke:#4f2ea7,stroke-width:2px,color:#24124b
    style MySQL fill:#00bcd4,stroke:#fff,color:#fff
    style WinFunc fill:#ffd6e5,stroke:#a82757,stroke-width:2px,color:#4a1028
    style Project fill:#ff9800,stroke:#fff,color:#fff
SQL 学习路径知识图谱

图谱从 SQL 学习体系出发,分为 MySQL 核心教程、窗口函数专题与淘宝实战项目。MySQL 路径继续细分为基础篇与进阶篇,窗口函数覆盖排名、位移、帧子句和分布函数,实战项目覆盖导入、清洗、行为分析和 RFM 分层。


🎯 数据分析师学习优先级

聚焦原则

MySQL 体系庞大(含 DBA 运维内容),数据分析师应遵循 "去肥增瘦" 原则,把时间花在取数效率分析能力上。

模块 优先级 核心理由
DQL 查询 & 多表连接 ⭐⭐⭐ 必学 日常取数的基石,面试必考
索引 & SQL 优化 ⭐⭐⭐ 必学 千万级数据不懂索引 = 查询超时,掌握 EXPLAIN 是分水岭
窗口函数 ⭐⭐⭐ 必学 排名、同比环比、留存分析的利器,面试高频考点
实战项目 ⭐⭐⭐ 必做 打通"导入 → 清洗 → 分析 → 可视化"全链路,简历加分项
视图 ⭐⭐ 推荐 封装复杂分析逻辑(如留存率计算),方便复用
存储过程 & 触发器 ⭐ 选学 现代架构多用 Python/Airflow 做 ETL,读懂即可
运维篇 ❌ 跳过 主从复制、分库分表由 DBA 负责

📊 内容规模一览

模块 文档数 核心知识点
MySQL 核心教程 4 篇 DDL/DML/DQL、多表查询、事务、索引、SQL 优化、视图、锁
窗口函数专题 2 篇 排名/位移/聚合窗口、帧子句、分布函数、WINDOW 子句复用
淘宝实战项目 3 篇 亿级导入、数据清洗、漏斗分析、RFM 分层、热门商品分析

🔗 延伸资源

学习建议

实践优先:每学完一个章节,务必在本地 MySQL 环境中亲自执行 SQL。对于 EXPLAIN 执行计划,尝试对比加索引前后的查询行数差异,会有醍醐灌顶的体验。