SQL PostgreSQL 的 GIN / GiST / SP-GiST / BRIN / Bloom 索引类型决策树

3次阅读

GIN索引适合数组、JSONB、全文检索等多值字段场景，因其为每个元素建倒排条目，能高效支持@>、@@等操作；但写入慢、体积大、不支持ORDER BY，切勿滥用在普通字符串字段上。

GIN（Generalized Inverted Index）专为数组、JSONB、全文检索等“多值字段”设计。它把每个元素单独建倒排条目，查 tags @> Array['pg'] 或 to_tsvector('text') @@ to_tsquery('search') 时效率高。

但代价明显：写入慢、体积大、不支持 ORDER BY 加速。
常见错误是给普通字符串字段建 GIN——比如 name VARCHAR 上建 GIN (name)，结果查询没变快，INSERT 却拖慢 3 倍。

GiST 是通用框架，支持 R-tree（几何）、B-tree-like（范围）、KNN 搜索；SP-GiST 是它的“轻量分支”，专注非平衡树结构，比如地理分区或前缀树。

典型踩坑：用 GiST 加速 IP 地址查询（inet 类型），却忽略 SP-GiST 对 inet 的原生优化。实测中，SP-GiST 在 ip 这类前缀匹配上内存更少、构建更快。

BRIN（Block Range INdex）不存每行键值，而是记录每个页块（block range）的 min/max 值。所以它极省空间、创建飞快，但只对「天然有序」或「按时间/ID 批量写入」的数据有用。

你如果给一个随机插入的 user_id UUID 字段建 BRIN，基本等于没建——因为每个块的 min/max 几乎无区分度，查询时仍要扫大量块。

Bloom 是概率型索引，只回答“这个值很可能不存在”，误判率可调（默认 0.01）。它对等值查询（=）有加速作用，尤其适合宽表中多个低选择性字段联合过滤。

但它不存原始值，也不支持 IS NULL、范围、排序——甚至不能保证 = 查询一定快：如果误判率高或缓存未命中，反而比顺序扫描还慢。

实际选型时，最常被忽略的是数据写入模式和物理顺序——索引再 fancy，数据在磁盘上乱成一团，BRIN 和 Bloom 就直接失效；而 GIN/GiST 的开销，往往在批量导入时才暴露出来。

发表于：php框架

近两天内

复制链接

币安Binance官网地址发布页币安App v9.8.0版最新更新日志

iPad用HTML5导入表格乱码怎么处理_HTML5导入iPad表格整序法【对策】