排序规则(Collation)决定字符比较和排序标准,ORDER BY仅按该规则执行排序;它影响字符串比较、ORDER BY顺序、索引效率及Unicode处理,可在列、数据库、服务器、表达式四级设置。

sql排序规则不是靠ORDER BY设置的,而是由排序规则(Collation)决定的——它控制字符怎么比大小、是否区分大小写、重音、Unicode处理方式等。而ORDER BY只是“按规则排”,不定义规则本身。
排序规则(Collation)到底管什么
它是一套字符比较和排序的底层约定,影响:
- 字符串比较结果:比如
'apple' = 'apple'是否成立 - ORDER BY对文本字段的排序顺序:是
A, a, B, b还是A, B, a, b - 索引能否高效支持模糊查询或大小写无关搜索
- 数据库迁移或跨库连接时,中文、日文、emoji等Unicode字符是否乱序或报错
排序规则在哪一级可以设置
它可以在四个层级指定,优先级从高到低:
- 列级别:建表时直接指定,最精细,例如:
CREATE table users (name VARchar(50) COLLATE Chinese_PRC_CI_AS); - 数据库级别:创建数据库时设定,默认影响所有新字符列
- 服务器级别:安装SQL Server时确定,是整个实例的兜底规则
- 表达式级别:查询中临时覆盖,例如:
select * FROM users ORDER BY name COLLATE Latin1_General_CS_AS;
常见排序规则命名含义
以 SQL Server 为例,名称如 Chinese_PRC_CI_AS 或 Latin1_General_CI_ai 中:
- Chinese_PRC:针对中国大陆简体中文的字典顺序和拼音规则
- CI = Case Insensitive(不区分大小写)
- CS = Case Sensitive(区分大小写)
- AI = Accent Insensitive(不区分重音,如é 和 e 视为相同)
- AS = Accent Sensitive(区分重音)
选错可能让WHERE name = 'li'查不到'li',或让ORDER BY city把“上海”排在“北京”后面。
ORDER BY 和排序规则的关系
ORDER BY执行时,完全依赖当前字段所用的排序规则来判断“谁大谁小”:
- 数值、日期类型不受排序规则影响,只看值本身
- 字符类型(CHAR/VARCHAR/NVARCHAR)必须通过排序规则才能比较
- 同一查询中不同列可有不同排序规则,ORDER BY会各自按本列规则比对
- 若显式用
COLLATE临时更改,ORDER BY就按新规则排,不改原列定义
比如:SELECT * FROM users ORDER BY last_name COLLATE SQL_Latin1_General_CP1_CI_AI; —— 这条语句临时用西欧规则排姓氏,不影响表结构。
基本上就这些。搞清“排序规则定标准,ORDER BY照标准排”,就不会再把两者混淆了。