如何在裸设备上部署Oracle_Udev规则配置与设备持久化绑定

2次阅读

udev规则须用WWID等稳定标识绑定裸设备,设OWNER=”oracle”、GROUP=”oinstall”、MODE=”0660″,限定SUBSYSTEM==”block”和DEVTYPE==”disk”,重载后需udevadm trigger生效,否则Oracle启动失败。

udev规则里怎么写才能让Oracle识别裸设备

裸设备必须通过 sysfs{idvendor}sysfs{idproduct}wwid 这类稳定标识绑定,不能用 /dev/sdb 这种内核分配的临时名。否则重启后设备名一变,oracle控制文件或数据文件路径就指向错地方了。

实操建议:

  • scsi_id -g -u -d /dev/sdX(RHEL 6/7)或 wwid 字段(RHEL 8+)获取唯一磁盘标识,优先选这个,比 vendor/product 更可靠
  • 规则中必须包含 OWNER="oracle"GROUP="oinstall"MODE="0660",缺一不可,否则 Oracle 进程读不到设备
  • 别用 KERNEL=="sd*" 直接匹配,要加 SUBSYSTEM=="block"DEVTYPE=="disk" 限定,避免规则误命中分区或 LVM 设备
  • 规则文件名必须以 .rules 结尾,且放在 /etc/udev/rules.d/ 下,推荐用 99-oracle-asm.rules 这种带序号的命名,防止被其他规则覆盖

为什么 reload udev 后设备权限还是不对

常见错误是只执行 udevadm control --reload-rules,但没触发规则重应用。udev 规则变更后,旧设备节点不会自动更新权限和属主,必须显式触发事件或重新扫描。

实操建议:

  • 改完规则后,先运行 udevadm control --reload-rules,再运行 udevadm trigger --subsystem-match=block --action=change
  • 如果设备已挂载或正被 Oracle 使用,trigger 可能不生效,此时需手动测试:运行 udevadm test /sys/class/block/sdX 看输出里是否命中你的规则、OWNER/GROUP 是否正确
  • 检查 /var/log/messagesjournalctl -u systemd-udevd,搜索 Errorfailed,常因路径写错(比如把 SYSFS 写成 SYSFS_)或权限语法不合法导致静默失败

ASM 磁盘组启动时报 ORA-15032 / ORA-15017 怎么排查

这类错误表面是 ASM 无法访问磁盘,90% 源头在 udev 绑定失效:设备节点不存在、权限不对、或者 WWID 匹配失败导致规则根本没生效。

实操建议:

  • 先确认设备节点是否存在:ls -l /dev/oracleasm/(或你自定义的前缀路径),看目标设备是否在列、属主是否为 oracle:oinstall、权限是否为 brw-rw----
  • blkid /dev/sdXscsi_id -g -u -d /dev/sdX 对比,确保规则里写的 WWID 和实际磁盘完全一致(注意空格和大小写)
  • 检查 asm_diskstring 参数是否指向正确的路径,比如设成了 /dev/oracleasm/*,但 udev 规则生成的是 /dev/asm-disk*,就会找不到盘
  • RHEL 8+ 默认启用 udevevent_timeout 限制,若磁盘响应慢,可能触发超时跳过,可在规则里加 ENV{ID_SERIAL_SHORT}!="", ENV{ID_SERIAL_SHORT}=="%s{ID_SERIAL_SHORT}" 做双重校验

Oracle 安装后新增裸设备,udev 规则要怎么追加

不能直接复制旧规则改设备名——新磁盘的 WWID 肯定不同,而且 udev 不允许用 KERNEL=="sdX" 这种动态名做匹配,否则下次重启又漂移。

实操建议:

  • 对每块新盘单独跑 scsi_id -g -u -d /dev/sdY,拿到 WWID 后,按原规则模板新增一行,只改 WWID 值和 SYMLINK 名称
  • 不要合并多块盘到一条规则里,udev 不支持 || 逻辑,必须拆成多行,每行一个 WWID
  • 新增后务必验证:拔插一次 SAS/SATA 线(或重启存储控制器),看设备节点是否重建且权限不变,这是最贴近生产故障的测试方式
  • 如果用 multipath,规则要写在 multipath.conf 里并配合 udev,不能只靠底层 sdX 规则,否则 failover 后路径会断

裸设备绑定这事,核心就一条:所有依赖项都得有物理层稳定性。WWID 错一位、MODE 少个零、trigger 忘执行,都会让 Oracle 在启动那一刻卡死。别信“配置完就能用”,每次加盘、换线、升级内核,都得重走一遍验证链。

text=ZqhQzanResources