kaikai's wiki

❯

❯

连接操作

2026年4月16日3分钟阅读

SQL
连接
索引
性能

来源：markus-winand · 原文

很多关于 join 的建议之所以听起来永远像套话，是因为它们绕过了一个核心前提：数据库到底打算用哪种 join 算法。这一章的价值，就在于把这个前提重新摆到台面上。

核心视角

这一部分的重要启发是：join 是否快，取决于数据库打算用哪种 join 算法，而不同算法对应的索引策略并不一样。

三类连接策略

Nested Loops：外层每出一行，就去内层查一次；
Hash Join：先把一侧装进哈希表，再用另一侧探测；
Sort-Merge Join：把双方都整理成有序流，再合并。

索引策略为何不同

对 nested loops，内表的 join key 索引非常关键，因为它要被反复探测；
对 hash join，join key 索引未必是重点，更重要的是索引独立的 where 过滤条件，缩小进入哈希表的候选集；
对 sort-merge join，索引的价值更多在于提前提供顺序，减少额外排序。

ORM 视角的补充

书里借 N+1 问题和 partial objects 说明，很多 ORM 性能问题并不神秘，本质上只是把某种连接策略的成本放大了。特别是 nested loops 型访问，如果在应用层重复触发，会把 B-tree 遍历和回表次数成倍放大。

这一章的价值

它把“给 join 列建索引”这种粗糙建议，推进成了更精确的问题：当前执行计划到底在做哪种 join，而索引该服务哪个动作？ 我觉得这也是整套书特别强的一点：它一直在逼你把模糊经验升级成可操作的条件句。

相关页面：use-the-index-luke · sql-join-performance · sql-execution-plans · query-shape-and-index-usage

关系图谱

核心视角
三类连接策略
索引策略为何不同
ORM 视角的补充
这一章的价值

反向链接

内容目录
SQL 索引教程总览
SQL 执行计划
SQL 连接性能

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community