干了六年才总结出来的查询优化经验，全是干货

山峰哥

504人浏览 · 2026-05-15 08:27:20

山峰哥 · 2026-05-15 08:27:20 发布

干了六年才总结出来的查询优化经验，全是干货

半夜两点半，手机突然炸了，运维在群里疯狂@所有人："数据库CPU 99%，系统快崩了！"我从被窝里爬起来，打开慢查询日志一看——果然，又是一条SQL在作妖。干了六年后端，我太清楚了：百分之八十的线上事故，根子都出在数据库查询上。今天我不讲那些虚头巴脑的理论，直接把我这些年亲手优化过的三个真实案例掏出来，从索引设计到Explain分析，全是能直接拿去用的干货。

数据库工程与查询优化案例实战

一、先搞清楚：为什么你的SQL会慢

☆ 很多开发者写SQL的时候，只关心"能不能查出来"，从来不关心"查得快不快"。等数据量一上来，问题就全暴露出来了。其实SQL慢，归根结底就那么几个原因：

1、没有走索引，全表扫描。数据库得把几百万行数据一行一行地比对，能不慢吗？

2、索引建错了，或者压根没建在该建的地方。比如你按时间查，结果给姓名建了个索引，那基本等于白搭。

3、JOIN写法有问题，导致中间结果集爆炸。两张大表一JOIN，中间可能产生几百万行的临时结果，内存直接撑爆。

4、SELECT * 查了一堆用不上的字段，网络传输和内存开销都白白浪费了。

☆ 所以查询优化这件事，说白了就是四个字：减少扫描。让数据库用最小的代价，找到你真正需要的那几行数据。接下来我用三个真实案例，带你一步步把慢查询干掉。

二、案例一：电商订单列表，从5秒优化到3毫秒

1、问题描述

☆ 去年接手了一个电商项目，用户反馈"我的订单"页面加载特别慢，动辄四五秒。我打开代码一看，SQL是这么写的：

sql

SELECT * FROM orders WHERE user_id = 10086 ORDER BY create_time DESC LIMIT 20;

☆ orders表有将近600万条数据，user_id字段上没有任何索引。

2、问题出在哪

☆ 这条SQL至少犯了三个错误：

（1）用了SELECT *，把订单详情、备注、物流信息全拉出来了，但页面其实只需要订单号、金额、状态、时间这几个字段。

（2）user_id没有索引，MySQL只能全表扫描，600万行一行一行地比对user_id。

（3）虽然加了LIMIT 20，但数据库得先把所有符合条件的行全部找出来、排好序，然后才能取前20条。也就是说，LIMIT在这里几乎没起到作用。

3、优化过程

☆ 第一步，建联合索引：

sql

CREATE INDEX idx_user_time ON orders(user_id, create_time DESC);

☆ 为什么要把create_time也放进索引？因为查询里有ORDER BY create_time DESC，把排序字段也加进索引，数据库就可以直接按索引顺序读取，不用再额外做文件排序了。

☆ 第二步，改写SQL，只查需要的字段：

sql

SELECT order_id, create_time, total_amount, status

FROM orders

WHERE user_id = 10086

ORDER BY create_time DESC

LIMIT 20;

4、效果对比

对比项优化前优化后

扫描方式全表扫描（type=ALL）索引范围扫描（type=range）

扫描行数约600万行 20行

执行时间 4.7秒 0.003秒

是否文件排序是（Using filesort）否（索引已有序）

☆ 从将近5秒降到3毫秒，提升了一千五百多倍。就改了两行代码、加了一个索引，效果就是这么炸裂。

三、案例二：统计报表慢到离谱，换个写法快了20倍

1、问题描述

☆ 另一个项目有个运营后台，需要统计每个商品分类的销售总额。原始SQL长这样：

sql

SELECT c.category_name, SUM(o.total_amount) as total_sales

FROM categories c

LEFT JOIN orders o ON c.id = o.category_id

GROUP BY c.category_name;

☆ categories表大概300条数据，orders表有1200万条。这条SQL跑一次要将近10秒，运营同学天天投诉。

2、问题分析

☆ 很多人一看"统计每个分类的总额"，第一反应就是JOIN加GROUP BY。逻辑上没毛病，但性能上是个大坑。

☆ 你想啊，LEFT JOIN会先把两张表做关联，orders有1200万行，关联之后中间结果集依然是1200万行级别。然后再对这1200万行做GROUP BY聚合，MySQL得开临时表、做文件排序，开销巨大。

3、优化方案：先聚合再关联

sql

SELECT c.category_name,

COALESCE(t.total_sales, 0) as total_sales

FROM categories c

LEFT JOIN (

SELECT category_id, SUM(total_amount) as total_sales

FROM orders

GROUP BY category_id

) t ON c.id = t.category_id;

☆ 核心思路是：先在orders表内部完成聚合，把1200万行压缩成几百行（每个分类一行），然后再和categories表做关联。这样JOIN的数据量就从1200万降到了几百，性能自然起飞。

4、效果对比

对比项直接JOIN写法子查询先聚合写法

JOIN时的数据量约1200万行约300行

是否使用临时表是否

执行时间 9.8秒 0.45秒

性能提升倍数基准约22倍

☆ 同样的业务结果，换一种写法，性能直接提升二十多倍。所以说，不要迷信JOIN，有时候把子查询用对了，比JOIN快得多。

四、案例三：用Explain揪出那个"隐藏杀手"

1、Explain是什么

☆ MySQL提供了一个超级好用的命令叫EXPLAIN，你在任何SELECT语句前面加上它，MySQL就会告诉你它打算怎么执行这条SQL。这就相当于给SQL做了个CT扫描，哪里有问题一目了然。

2、一次真实的排查经历

☆ 有一次线上出现慢查询告警，SQL看着特别简单：

sql

SELECT * FROM user_login_log WHERE action = 'login' AND log_time > '2024-01-01';

☆ 我跑了一下Explain：

id select_type table type possible_keys key key_len rows Extra

1 SIMPLE user_login_log ALL NULL NULL NULL 4500000 Using where

☆ 一看就知道问题大了：

（1）type = ALL，全表扫描，这是最差的情况。

（2）possible_keys = NULL，说明压根没有可用的索引。

（3）rows = 4500000，预计要扫描450万行。

（4）Extra = Using where，说明过滤是在存储引擎层做的，效率很低。

3、加索引，再看一次

sql

ALTER TABLE user_login_log ADD INDEX idx_action_time(action, log_time);

☆ 再次Explain：

id select_type table type possible_keys key key_len rows Extra

1 SIMPLE user_login_log ref idx_action_time idx_action_time 767 280 Using index condition

☆ 变化非常直观：

（1）type从ALL变成了ref，说明走索引了。

（2）rows从450万降到了280，扫描行数断崖式下降。

（3）Extra变成了Using index condition，说明索引下推生效了。

4、Explain到底怎么看

☆ 这几年我排查慢查询，Explain看了不下几千次，总结下来最关键的就看这几列：

（1）type列：这是最重要的指标。从好到差依次是 system > const > eq_ref > ref > range > index > ALL。你的SQL至少要达到range级别，最好是ref或eq_ref。如果是ALL，那就是全表扫描，必须优化。

（2）key列：看实际用了哪个索引。如果是NULL，说明没用上任何索引。

（3）rows列：预估扫描行数。这个数字越小越好，最好是个位数或者两位数。

（4）Extra列：这里面信息量很大。如果出现Using filesort，说明有额外的文件排序开销；如果出现Using temporary，说明用了临时表，这两种情况都要尽量避免。最理想的情况是出现Using index，说明走了覆盖索引，性能最优。

五、索引策略：不是越多越好

1、一个常见的坑

☆ 我见过不少团队，觉得索引是万能药，恨不得给每个字段都建一个。结果呢？写入性能暴跌，因为每次INSERT、UPDATE、DELETE都要同步更新所有索引。而且索引太多，优化器反而会选错索引，性能更差。

2、几条实用的索引原则

（1）优先给WHERE、JOIN、ORDER BY、GROUP BY里出现的字段建索引。这是最基本的，也是最有效的。

（2）联合索引一定要注意最左前缀原则。比如你建了(a, b, c)的联合索引，那么WHERE a=1能用上索引，WHERE a=1 AND b=2也能用上，但如果你只写WHERE b=2，索引就废了。所以建联合索引的时候，把区分度最高、最常用的字段放在最左边。

（3）区分度低的字段别建索引。比如"性别"字段，只有男和女两个值，建了索引也没啥用，因为数据库扫描完索引还是得回表查大量数据。但像"身份证号""手机号"这种区分度极高的字段，建索引效果立竿见影。

（4）能用覆盖索引就别回表。所谓覆盖索引，就是索引本身就包含了查询需要的所有字段，数据库根本不用去查原始数据行。比如前面案例一里的idx_user_time(user_id, create_time)，如果你只查user_id、create_time、order_id这几个字段，那就能走覆盖索引，速度是最快的。