当前位置：首页 > news >正文

AI 建议加索引后查询仍变慢：从联合索引、回表与分页排序看慢 SQL 排查

news 2026/6/26 3:34:47

慢 SQL 出现后，最常见的第一反应通常是：

这个字段经常查，那就在这个字段上加个索引。

很多 AI 辅助开发场景里，得到的建议也往往类似：

CREATEINDEXidx_orders_statusONorders(status);CREATEINDEXidx_orders_created_atONorders(created_at);CREATEINDEXidx_orders_tenant_idONorders(tenant_id);

然后开发者重新执行查询，发现耗时不但没有明显下降，有时甚至更慢。

问题不一定出在数据库“没有使用索引”。

更常见的情况是：索引确实存在，但它没有匹配真正的查询模式。

例如，订单后台需要查询某个租户最近 7 天的待处理订单：

SELECTid,order_no,total_amount,created_atFROMordersWHEREtenant_id=10086ANDstatus='PENDING'ANDcreated_at>='2026-06-01 00:00:00'ANDcreated_at<'2026-06-08 00:00:00'ORDERBYcreated_atDESC,idDESCLIMIT50;

这条 SQL 看起来并不复杂。

但它同时包含了：

等值过滤：tenant_id
等值过滤：status
范围过滤：created_at
排序：created_at DESC, id DESC
分页：LIMIT 50
返回列：order_no、total_amount

如果只是分别建立几个单列索引，数据库未必能找到一条真正低成本的访问路径。

它可能仍然需要：

扫描大量索引记录；
根据条件过滤；
回表读取更多字段；
额外排序；
最后才截取 50 条结果。

所以，慢 SQL 排查的第一步，不是“先加索引”。

而是先回答：

这条查询到底希望数据库以什么顺序、从什么范围、读取多少数据？

一、最常见的错误：给每个筛选字段各建一个单列索引

假设当前表里存在这些索引：

KEYidx_tenant_id(tenant_id),KEYidx_status(status),KEYidx_created_at(created_at)

很多人会认为，查询同时用了三个字段，数据库总能“组合利用”它们。

现实里不一定如此。

单列索引更像三条独立道路：

tenant_id → 找到这个租户的数据 status → 找到待处理订单 created_at → 找到指定时间范围的数据

但你的目标不是单独走其中一条路。

你真正需要的是一条尽量接近以下路径的组合道路：

先定位 tenant_id ↓ 在该租户内定位 status ↓ 在该状态下按 created_at 倒序取最近记录 ↓ 再按 id 保证排序稳定 ↓ 尽可能少回表

如果数据库只先使用了idx_status，而PENDING状态在全表中占比很高，它仍然可能需要扫描大量记录。

如果先使用了idx_created_at，虽然时间范围有限，但租户和状态过滤仍会发生在之后。

如果选择索引合并，执行计划看起来像“用了多个索引”，但它仍可能需要合并结果、回表、过滤和排序。

所以，单列索引很多，并不代表查询一定快。

真正重要的是：索引结构是否与查询条件、排序方式和数据分布一致。

二、慢 SQL 先别急着优化，先读清楚它在做什么

以这条 SQL 为例：

SELECTid,order_no,total_amount,created_atFROMordersWHEREtenant_id=?ANDstatus=?ANDcreated_at>=?ANDcreated_at<?ORDERBYcreated_atDESC,idDESCLIMIT50;

先把它拆成四个问题。

查询部分	需要确认的事
`tenant_id = ?`	单个租户的数据量大不大
`status = ?`	这个状态的选择性高不高
`created_at`范围	时间窗口通常多大
`ORDER BY`	能否复用索引顺序，避免额外排序
返回字段	是否会产生大量回表
`LIMIT 50`	是首页查询，还是深分页查询

这里有一个常见误区：

LIMIT 50很小，所以查询一定不重。

不一定。

数据库可能先扫描 20 万条候选记录，再排序，最后只返回 50 条。

返回结果少，不代表执行过程中读取的数据少。

因此，分析时要重点看：

扫描行数是否远大于返回行数；
是否出现额外排序；
是否发生大量回表；
是否使用了不匹配的索引；
是否因为深分页跳过了过多记录。

三、联合索引不是字段拼接，而是查询路径设计

针对上面的查询，一个更符合访问路径的索引通常是：

CREATEINDEXidx_orders_tenant_status_created_idONorders(tenant_id,status,created_atDESC,idDESC);

它的逻辑是：

tenant_id：先缩小到一个租户 ↓ status：继续缩小到目标状态 ↓ created_at：按时间范围过滤并支持排序 ↓ id：保证同一时间下的顺序稳定

这里的顺序不是随便排的。

一般情况下，联合索引设计可以优先考虑：

等值条件 ↓ 等值条件 ↓ 范围条件 ↓ 排序字段 ↓ 必要的补充字段

不过，这不是死规则。

真正要看的是实际查询模式。

例如下面两条 SQL：

-- 查询一：指定状态，按创建时间倒序WHEREtenant_id=?ANDstatus=?ORDERBYcreated_atDESC,idDESC-- 查询二：不指定状态，只按创建时间倒序WHEREtenant_id=?ORDERBYcreated_atDESC,idDESC

它们可能需要不同的索引策略。

因为第一条适合：

(tenant_id,status,created_atDESC,idDESC)

而第二条更接近：

(tenant_id,created_atDESC,idDESC)

不能因为一条 SQL 优化好了，就默认所有查询都应该走同一个超长联合索引。

索引不是越多越好，也不是越长越好。

每增加一个索引，写入、更新和维护成本也会随之增加。

四、为什么“加了联合索引”还是可能慢

假设你已经有：

CREATEINDEXidx_orders_tenant_status_created_idONorders(tenant_id,status,created_atDESC,idDESC);

查询仍然慢，可能有以下几种原因。

1. 返回字段导致大量回表

索引里只有：

tenant_id status created_at id

而查询还需要：

order_no total_amount

数据库可能先通过索引找到符合条件的id，再回到主表读取order_no和total_amount。

如果候选集很大，回表成本就会明显上升。

这时不要本能地把所有字段都塞进索引。

先问：

这条查询是否非常高频；
返回列是否固定；
total_amount是否需要精确读取；
是否可以拆成“先查 ID，再按需补充详情”；
是否需要做专门的查询表或汇总表。

对于某些高频列表查询，可以考虑覆盖索引：

CREATEINDEXidx_orders_list_coveringONorders(tenant_id,status,created_atDESC,idDESC,order_no,total_amount);

但它不是免费优化。

索引变宽之后：

占用空间会增加；
写入更新成本会增加；
页分裂和维护成本可能上升；
不常用的大字段会拖慢索引扫描。

是否需要覆盖索引，应该由访问频率、读写比例和压测结果决定。

2. 排序方向和索引顺序不匹配

例如索引是：

(tenant_id,status,created_at,id)

而 SQL 写的是：

ORDERBYcreated_atDESC,idASC

不同数据库版本和执行策略下，未必都能高效利用这个索引顺序。

更稳妥的工程习惯是：

明确排序字段；
明确排序方向；
在测试环境观察是否仍然发生额外排序；
不要只看“索引存在”，要看查询是否真正按索引顺序读取。

特别是列表页、导出任务、同步任务里，排序稳定性会直接影响分页结果。

3. 深分页让`LIMIT`失去意义

例如：

LIMIT20OFFSET100000;

即使索引顺序正确，数据库仍然可能需要先跳过前面 10 万条记录，才能返回第 100001 到 100020 条。

这时优化方向不应该是继续给 OFFSET 加索引。

更应该改为游标分页：

SELECTid,order_no,total_amount,created_atFROMordersWHEREtenant_id=?ANDstatus=?AND(created_at<:lastCreatedAtOR(created_at=:lastCreatedAtANDid<:lastId))ORDERBYcreated_atDESC,idDESCLIMIT20;

这里的核心不是“SQL 更复杂”。

而是把“跳过多少行”换成“从上一页最后一条记录之后继续”。

对于高频列表、历史记录浏览和大数据量后台查询，这种差异会越来越明显。

五、让 AI 先解释执行计划，再让它给索引建议

很多人直接问 AI：

这条 SQL 很慢，帮我加个索引。

得到的结果通常是一条看起来合理的CREATE INDEX。

但更有效的提问方式是：

你是数据库性能评审助手。 下面是一条订单列表查询和它的执行计划摘要。 请先不要直接生成建索引 SQL。 请完成： 1. 区分过滤条件、范围条件、排序条件和返回列； 2. 判断现有索引为什么没有完全匹配查询路径； 3. 分析是否存在回表、额外排序或深分页问题； 4. 给出最多 2 种联合索引候选，并说明各自适用场景； 5. 列出新增索引对写入和更新的潜在影响； 6. 设计上线前需要验证的 SQL、压测指标和回滚条件。 SQL： [粘贴脱敏后的 SQL] 执行计划： [粘贴 EXPLAIN 摘要]

这样做的目的，不是让 AI 少写代码。

而是先让它把“慢在哪里”解释清楚。

对于已经把 ChatGPT Plus、GPT Plus 用在 SQL 排查、执行计划解释、代码评审和测试补全中的开发者来说，长期使用的价值不在于每次直接得到一个索引答案，而在于是否能逐步建立一套固定的分析路径：先看查询模式，再看执行计划，再决定索引和验证方式。

对已经确认有 AI 工具长期使用需求的开发者来说，工具准备不只是模型能力，还包括使用周期、说明理解、边界意识和异常处理路径；相关信息可按实际需要参考：gpt985com

六、上线前不要只看 EXPLAIN，要做真实负载验证

索引建议在测试库里看起来合理，不代表生产环境一定适合。

因为真实环境还会受到这些因素影响：

数据量级不同；
数据分布不同；
某些状态占比极高；
热点租户的数据特别集中；
写入频率远高于测试库；
缓冲池和磁盘状态不同；
线上同时存在其他查询竞争资源。

上线前建议至少准备下面的验证表。

验证项	需要确认的问题
扫描行数	是否显著降低不必要扫描
返回行数	与业务预期是否一致
排序行为	是否仍发生额外排序
回表次数	是否成为主要瓶颈
P95 / P99 耗时	高峰期是否仍可接受
写入耗时	新索引是否拖慢下单、更新状态等关键写入
锁等待	是否增加事务竞争
索引命中	新索引是否真的被高频查询使用

如果运行环境支持执行计划实际统计，也可以在压测环境中进一步核对：

EXPLAINANALYZESELECTid,order_no,total_amount,created_atFROMordersWHEREtenant_id=10086ANDstatus='PENDING'ANDcreated_at>='2026-06-01 00:00:00'ANDcreated_at<'2026-06-08 00:00:00'ORDERBYcreated_atDESC,idDESCLIMIT50;

重点不是死盯某个字段名称。

而是看：

实际读取了多少行；
过滤发生在什么位置；
排序耗时是否仍然明显；
是否出现预期外的全表扫描；
索引是否只解决了部分问题。

七、慢 SQL 优化后，至少补这些回归场景

索引优化也可能改变查询路径和资源竞争方式。

因此，建议至少覆盖以下场景：

场景	预期结果
普通租户查询	正常返回，排序稳定
热点租户查询	耗时可控，不放大扫描
高占比状态查询	不因低选择性导致明显退化
时间范围很小	索引能快速定位
时间范围较大	不出现异常排序或大量回表
首页面查询	低延迟返回
深分页查询	使用游标或明确限制
高频写入期间查询	不出现明显锁等待和性能抖动
新索引回滚后	业务查询仍可恢复到原有路径