SQL LAG / LEAD / FIRST_VALUE / LAST_VALUE 的时序分析经典写法

3次阅读

LAG和LEAD必须同时配PARTITION BY与ORDER BY才可靠：缺PARTITION BY则全表成一区，缺ORDER BY则行为未定义；FIRST_VALUE/LAST_VALUE默认帧不覆盖全分区，需显式声明ROWS UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING。

LAG 和 LEAD 必须配 PARTITION BY + ORDER BY 才可靠

不加 PARTITION BY 时，整个结果集被当成一个分区；漏掉 ORDER BY 则行为未定义——多数数据库（如 postgresql、SQL Server）会报错，mysql 8.0+ 虽允许但返回随机行偏移，结果不可复现。

业务场景中，90% 的错误源于只写 ORDER BY 却忽略 PARTITION BY：比如查每个用户最近两次登录间隔，没按 user_id 分区，就会跨用户取值
LAG(col, 1) 默认取前 1 行，但若上一行不在同一分区内（例如分区边界），返回 NULL —— 这是正确行为，不是 bug
性能上，窗口函数依赖排序，ORDER BY 字段必须有索引，否则大表查询可能慢几秒甚至超时

FIRST_VALUE / LAST_VALUE 默认是 RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW

这个默认窗口帧（frame）常导致误解：比如想取“每个分组第一条记录的金额”，却在 ORDER BY create_time 下用了 FIRST_VALUE(amount)，结果拿到的是当前行之前（含当前行）最小时间对应的值，而非整个分区的第一条。

要取整个分区首/尾，必须显式声明 ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING
PostgreSQL 和 oracle 支持简写 ROWS UNBOUNDED，但 MySQL 8.0+ 不支持，必须写全
LAST_VALUE 尤其危险：不改 frame 时，它几乎总等于当前行值，因为默认范围不包含后续行

LEAD(n) 超出分区末尾返回 NULL，但不能靠它判断“是否为最后一条”

有人用 LEAD(id) IS NULL 当作“当前行是该用户最后一条记录”的条件，这在单分区、严格按时间排序时看似可行，但实际脆弱。

如果存在并列时间（create_time 相同），ORDER BY create_time 无法保证稳定排序，LEAD 可能跳过或错位
更可靠的方式是配合 ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY create_time DESC)，然后筛 rn = 1
另外，LEAD(col, 2) 在倒数第二行会返回 NULL，不是因为数据缺失，而是因为没有“后两行”——这点容易被当成脏数据误处理

时序分析中混用聚合和窗口函数容易触发 SQL 错误

比如写 select user_id, AVG(LAG(amount)) OVER (...) FROM t，MySQL 和 PostgreSQL 都会报错：Window function is not allowed in aggregation。

窗口函数不能嵌套在聚合函数里，也不能出现在 GROUP BY 子句或 HAVING 条件中（除非外层是窗口）
常见替代：先用子查询或 CTE 算出 LAG 值，再对外层结果做 AVG
BigQuery 允许 AVG(LEAD(x)) OVER(...)，但这是特例，别默认其他引擎也支持

时序分析真正卡住人的地方，往往不是语法记不住，而是默认窗口帧、排序稳定性、NULL 边界这些隐含规则在不同数据库里的细微差异——调通一条语句后，换环境或加个索引，就可能跑出不一样结果。

发表于：数据库

近两天内

复制链接

mysql常见启动错误如何排查_mysql启动错误排查方法

如何用 HTML 和 JavaScript 构建可验证答案的多选题测验

SQL数据库SQL模板化_计划复用设计

SQL 聚合函数在大数据量中性能低怎么办？

HTML5密码怎么实现记住密码_本地存HTML5密码省心指南【指南】

SQL LAG / LEAD / FIRST_VALUE / LAST_VALUE 的时序分析经典写法

LAG 和 LEAD 必须配 PARTITION BY + ORDER BY 才可靠

FIRST_VALUE / LAST_VALUE 默认是 RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW

LEAD(n) 超出分区末尾返回 NULL，但不能靠它判断“是否为最后一条”

时序分析中混用聚合和窗口函数容易触发 SQL 错误

Laravel中如何实现用户登录验证_Laravel内置Auth认证系统使用方法【教程】

Phpstorm怎么启用PHP实时编辑_Phpstorm启用PHP实时编辑法【妙招】

狗狗币与主流币相比有哪些优势？狗狗币主流交易平台有哪些？

如何在 Go 中将字符串切片（或数组）连接为单个字符串

haproxy health check 失败的 check inter rise fall 配置

Linux 命令执行缓慢的可能原因

如何在 FastAPI WebSocket 中并发运行两个阻塞函数（线程方案）

如何在PHP中显示会话数据后安全销毁Session

Python 文件锁的实现方式与使用场景

币安Binance交易所注册教程币安v9.8.2最新官方App下载链接