DBA架构师指南:如何共享数据库架构ER模型_全局把控开发流

3次阅读

ER图字段顺序错因工具默认按字典序排序,非建表物理顺序;应通过SHOW CREATE table查真实顺序,导出时勾选列定义顺序选项,或用mysqldump+在线工具保序,严禁GUI另存版本,须统一git管理DDL源文件。

ER图导出时字段顺序乱了怎么办

导出的er图里字段排列和建表语句不一致,不是bug,是多数工具(如 mysql workbenchdbeaver)默认按字典序或内部id排序,而非建表时的物理顺序。开发看sql写逻辑,dba查依赖,顺序错容易漏判外键或非空约束影响。

  • MySQL 里用 SHOW CREATE TABLE 查真实定义顺序,别信图形界面的列展示
  • pgAdmin 导出DDL需勾选 Use column order from table definition(路径:Preferences → Export Options)
  • mysqldump --no-data --skip-triggers 生成结构脚本,再喂给 dbdiagram.ioquickdatabasediagrams.com,能保序
  • PowerDesigner 等企业级工具要手动右键表 → PropertiesColumns 标签页拖拽调整,导出前必须点 Apply

多人协作时ER模型版本对不上

开发改了字段类型,DBA没收到通知,下游报表SQL突然报 data type mismatch;或者两个分支各自加了同名但语义不同的 status 字段,合并后ER图里出现歧义节点。核心问题不在画图,而在模型变更没走同一出口。

  • 禁止直接在GUI工具里“另存为新版本”,所有变更必须提交到Git仓库的 schema/ 目录下,文件名带时间戳或Git commit hash,例如 user_20240521_v3.sql
  • liquibase diffflyway repair 对比测试库与主干DDL差异,生成可执行的 changelog.xml,而不是人工修图
  • ER图本身不进CI流程,但生成它的源文件(如 .json.sql)必须通过 sqlfluff 检查,防止 NOT NULL 缺失或注释格式不统一

线上库字段太多,ER图打开就卡死

一个微服务对应50+张表,每张表平均30个字段,用 draw.io 导入XML直接浏览器崩溃;navicat 的可视化ER功能加载超时,最后只看到半张图。这不是机器性能问题,是试图把全量元数据塞进一张图。

  • 先用 select table_name, count(*) FROM information_schema.columns WHERE table_schema='prod' GROUP BY table_name ORDER BY 2 DESC LIMIT 5 找出“巨无霸表”,单独建子图
  • dbdiagram.io 里上传SQL时,提前用 grep -E "CREATE TABLE (user|order|payment)" schema.sql > core_tables.sql 聚焦核心实体,别贪全
  • 真正需要全局视图时,用 erdgo 命令行工具生成文本关系图:erdgo -f mysql -i schema.sql -o erd.txt,轻量且可 grep 查关联路径

开发说“ER图没标索引”,DBA说“图不是用来管索引的”

争议本质是职责错位:ER图描述的是实体-关系-属性三层语义,索引是存储层优化手段,混在一起会导致设计退化——比如为迁就某个慢查询,在ER图里硬加冗余字段,破坏范式。

  • 索引信息应存在独立文档,格式统一为表格:table_name | index_name | columns | is_unique | comment
  • 若必须可视化,用 pt-online-schema-change --dry-run 输出的执行计划片段,贴在Confluence页面里,和ER图页面双向链接
  • EXPLAIN FORMAT=JSON 结果里的 keypossible_keys 字段,比ER图上画个“idx_user_email”更有决策价值

ER模型不是画得越全越好,而是谁在什么环节需要哪一层信息。开发改字段前看DDL,DBA调优时查执行计划,架构师评审时盯外键闭环——图只是切片,别让它变成遮挡真实数据流的幕布。

text=ZqhQzanResources