系统详解 SQL 优化，不用再背八股了！

Muyu1uz

414人浏览 · 2026-05-07 17:24:01

Muyu1uz · 2026-05-07 17:24:01 发布

在Java后端开发中，SQL查询的性能直接影响系统响应速度，尤其是面对百万级、千万级数据量时，一句低效SQL可能导致接口超时、系统卡顿。了解 SQL 优化无需高深的底层知识，掌握基础技巧并结合工具分析，就能大幅提升查询效率。以后再也不用担心面试问到了！

避免SELECT不必要的列

开发中最常见的低效写法之一，就是习惯性使用SELECT * 读取表中所有字段。这种写法看似便捷，其实存在问题：

增加网络传输负载和数据库IO压力，无关字段的读取会浪费资源；
阻碍查询优化，难以利用覆盖索引，增加回表开销，尤其在大表查询中影响显著。

索引的合理使用

索引是SQL优化的核心，如同书籍的目录，能帮助数据库快速定位数据，减少全表扫描。但索引并非越多越好，不合理的索引不仅无法提升性能，还会增加插入、更新、删除的开销——每次写操作都需要维护索引结构。

覆盖索引

覆盖索引是指索引包含查询语句中所有需要的字段（包括SELECT、WHERE、JOIN等子句涉及的字段），此时数据库无需回表查询完整数据行，仅通过索引本身就能获取所有所需信息，减少磁盘IO操作。在InnoDB存储引擎中，非主键索引仅包含索引列和主键值，若查询字段不在索引中，会先通过二级索引找到主键，再用主键去聚簇索引查询完整数据，这个过程称为“回表”，覆盖索引可直接跳过该步骤。

示例：查询用户表中部门为“技术部”的用户姓名和年龄，用户表已创建索引idx_department（仅包含department和id）。

非覆盖查询（需回表）：SELECT name, age FROM user WHERE department = '技术部'。执行流程：通过idx_department找到所有department='技术部'的id → 用id回表查询name和age → 多次磁盘IO，性能较差。
覆盖查询（无需回表）：先创建包含所需字段的复合索引CREATE INDEX idx_dept_name_age ON user (department, name, age)，再执行查询SELECT name, age FROM user WHERE department = '技术部'，可直接通过索引获取数据，查询效率大幅提升。

正确使用联合索引

联合索引是将多个字段组合创建的索引，适用于多条件联合查询场景，核心是遵循“最左前缀原则”——查询条件需从索引的最左列开始，且不能跳过中间列，否则索引会失效。

示例：创建联合索引idx_user_status_createTime (status, create_time, id)，分析不同查询语句的索引使用情况。

有效使用：SELECT id FROM user WHERE status = 1 AND create_time > '2024-01-01'（遵循最左前缀，使用索引）；
索引失效：SELECT id FROM user WHERE create_time > '2024-01-01'（跳过最左列status，索引失效，触发全表扫描）；
部分有效：SELECT id FROM user WHERE status = 1 AND id > 100（仅使用索引的status列，create_time列未被利用，效率低于完整匹配）。

注意：联合索引的字段顺序需结合查询场景设计，过滤条件频繁的字段应放在左侧，避免因顺序不合理导致索引失效。

避免索引失效

索引失效是开发中最易踩的坑，本质是MySQL优化器判断“使用索引比全表扫描更耗时”，或查询语句不符合索引使用规则。以下是3种高频失效场景，搭配案例说明如何规避。

场景1：索引字段使用函数操作。例如，user表的create_time字段建了索引，查询“2024年注册的用户”，使用YEAR()函数会导致索引失效：

失效写法：SELECT * FROM user WHERE YEAR(create_time) = 2024；
优化写法：SELECT * FROM user WHERE create_time BETWEEN '2024-01-01 00:00:00' AND '2024-12-31 23:59:59'。

场景2：索引字段使用模糊查询（前缀通配符）。例如，查询用户名包含“张”的用户，使用%开头会导致索引失效：

失效写法：SELECT * FROM user WHERE username LIKE '%张%'；
优化写法：若业务允许，改为后缀匹配SELECT * FROM user WHERE username LIKE '张%'（可使用索引）；若必须前缀模糊，可考虑全文索引或应用层过滤。

场景3：索引字段发生隐式类型转换。例如，user表的phone字段是varchar类型（建了索引），查询时传入数字类型会导致失效：

失效写法：SELECT * FROM user WHERE phone = 13800138000；
优化写法：SELECT * FROM user WHERE phone = '13800138000'（保证查询条件与字段类型一致）。

前缀索引

对于varchar、text等长字符串字段，直接创建普通索引会占用大量磁盘空间，且查询效率较低。前缀索引是截取字符串的前N个字符创建索引，既能减少索引占用空间，又能保证一定的查询效率，适用于字符串前缀区分度较高的场景（如手机号、邮箱）。

示例：用户表的email字段（长度50），大部分邮箱的前缀（前10个字符）已能区分不同用户，无需创建完整索引。

创建前缀索引：CREATE INDEX idx_email_prefix ON user (email(10))；

查询时，SELECT * FROM user WHERE email = 'test@163.com'，会通过前缀索引快速定位，再匹配完整邮箱地址，兼顾空间与效率。注意：前缀长度需合理选择，过短会导致区分度不足，过长则失去前缀索引的意义。

分页优化

分页查询是Java后端高频场景（如列表展示），常用写法为LIMIT offset, size，但当offset较大时（如LIMIT 10000, 20），数据库会扫描并丢弃前10000条数据，仅返回20条，导致查询效率急剧下降。以下两种优化方案，可根据业务场景选择。

延迟关联

核心思路是先通过覆盖索引快速定位主键，再回表取完整数据，避免在大结果集上搬运无关字段，减少IO和内存开销。

示例：订单表orders（百万级数据），需查询第10001-10020条订单详情，按创建时间倒序排列。

低效写法：SELECT * FROM orders ORDER BY create_time DESC LIMIT 10000, 20；

高效写法（延迟关联）：

SELECT o.* FROM orders o INNER JOIN (SELECT id FROM orders ORDER BY create_time DESC LIMIT 10000, 20) AS tmp ON o.id = tmp.id ORDER BY o.create_time DESC；

子查询仅操作轻量的id列（走索引），快速定位目标主键，再通过主键回表查询完整详情，大幅提升效率。注意：外层ORDER BY不可省略，MySQL不保证JOIN后顺序与子查询一致。

添加书签

核心是用上一页最后一条记录的排序值作为“锚点”，避免使用offset扫描无用数据，适用于无需跳转任意页码的场景（如移动端下拉加载）。

示例：同上订单表，已知上一页最后一条订单的create_time为'2024-05-20 14:30:00'，id为10000，查询下一页20条数据。

优化写法：SELECT * FROM orders WHERE create_time < '2024-05-20 14:30:00' AND id < 10000 ORDER BY create_time DESC, id DESC LIMIT 20；

通过上一页的create_time和id作为书签，直接定位下一页数据，无需扫描前10000条。注意：若排序字段不唯一（如create_time），需加入唯一字段（如id）消除歧义，避免数据重复或遗漏。

JOIN优化

JOIN查询用于关联多表数据，核心优化思路是“减少循环次数与单次循环开销”，避免因关联方式不当导致全表扫描，以下3个技巧覆盖高频场景。

尽量使用ON替代WHERE

JOIN查询中，ON用于指定表之间的关联条件，WHERE用于过滤最终结果。若将关联条件写在WHERE中，会导致数据库先执行全表关联，再过滤数据，增加无效关联开销；将关联条件写在ON中，会先过滤关联数据，再进行关联，效率更高。

小表驱动大表

JOIN查询的本质是“外层循环驱动内层循环”，小表驱动大表即让过滤后结果集较小的表作为外层循环（驱动表），大表作为内层循环（被驱动表），减少外层循环次数，从而降低整体开销。这里的“小表”不是指表的总行数，而是经过WHERE条件过滤后的结果集大小，这是常见误区。

示例：A表（用户表）有100万行，过滤后剩余100行；B表（订单表）有1万行，过滤后剩余500行。此时A表是“小表”，应作为驱动表。

优化写法：SELECT * FROM A WHERE status = 1 JOIN B ON A.id = B.user_id；

对于LEFT JOIN，左表默认是驱动表；RIGHT JOIN右表默认是驱动表；INNER JOIN则由优化器根据过滤结果集大小自动选择，可通过WHERE条件优先过滤驱动表，减少外层循环行数。

避免JOIN关联太多表

JOIN关联的表越多，数据库的关联开销越大，且容易导致索引失效、全表扫描。实战中，建议JOIN关联表数不超过3张，若需关联更多表，可通过以下方式优化：

拆分查询：将多表JOIN拆分为多个单表查询，在应用层组装数据；
冗余字段：将高频关联的字段冗余到主表中，减少JOIN次数（需权衡数据一致性）；
使用中间表：将多表关联的结果提前计算，存入中间表，查询时直接读取中间表数据。

排序优化

ORDER BY排序是高频操作，若排序字段未建索引，数据库会执行 filesort 操作（将数据加载到内存或磁盘中排序），效率极低，尤其在大数据量场景下。优化核心是“给ORDER BY字段建索引”，让数据库通过索引直接获取有序数据，避免filesort。

explain详解

explain是MySQL自带的查询分析工具，可模拟数据库优化器执行SQL语句，查看SQL的执行计划，快速定位低效环节（如全表扫描、索引失效、filesort等）。执行方式为在SQL语句前加上EXPLAIN，例如：EXPLAIN SELECT username FROM user WHERE status = 1；

以下重点解析执行计划中4个核心字段（id、select_type、table、type），覆盖开发中高频使用场景。