Linux 容器基础与 LXC 实战

7次阅读

lxc-start卡住因cgroup版本不兼容:宿主机启用cgroup v2时lxc 3.x默认走v1路径,需在容器配置中添加lxc.cgroup.version = 2;国内用户拉debian镜像应指定ustc等国内源;lxc-attach看不到/proc是因未挂载procfs,需确保容器配置含lxc.mount.auto = proc:rw。

Linux 容器基础与 LXC 实战

为什么 lxc-start 报 “failed to mount cgroup” 就卡住?

这是 LXC 启动容器时最常遇到的阻塞型错误,根本原因不是权限不够,而是宿主机内核没启用对应 cgroup 子系统,或 systemd 已抢占 cgroup v1 接口

lxc-start 默认尝试挂载 cgroupdevicesmemory 等子系统,但现代 linux(尤其 systemd 240+)默认只暴露部分接口,且优先使用 cgroup v2。LXC 3.x 默认仍走 v1 路径,两者不兼容。

  • 检查当前 cgroup 版本:cat /proc/cgroups(v1)或 stat -fc %T /sys/fs/cgroup/(输出 cgroup2fs 表示 v2)
  • 若是 cgroup v2,必须显式启用 LXC 的 v2 支持:在容器配置中加 lxc.cgroup.version = 2
  • 不要盲目改 /etc/default/grubcgroup_enable=memory——这仅对 v1 有效,v2 下反而可能引发冲突
  • 宿主机若跑的是 ubuntu 22.04+/Debian 12+,建议直接用 lxc launch(来自 lxd)替代裸 lxc-start,它自动适配 cgroup 版本

lxc-create 拉 Debian 镜像,为什么 debootstrap 总失败?

lxc-create 调用 debootstrap 时失败,90% 是网络或镜像源问题,不是命令写错。

debootstrap 在容器构建阶段完全依赖宿主机网络环境,且默认用 <a href="https://www.php.cn/link/75e604afe33f43eb0d06373b383ec430">https://www.php.cn/link/75e604afe33f43eb0d06373b383ec430</a>,而国内直连极慢甚至超时。

  • 指定国内镜像源:lxc-create -n mydeb -t debian -- -r bookworm -a amd64 --mirror <a href="https://www.php.cn/link/7c667fcefbc8afcb8641fd246d60c462">https://www.php.cn/link/7c667fcefbc8afcb8641fd246d60c462</a>
  • 如果宿主机用了代理(如 http_proxy),需确认 debootstrap 是否继承——它默认不读 shell 环境变量,得加 --include=ca-certificates 并手动设 --keyring 避免证书错误
  • 不要用 --arch i386 在 x86_64 宿主机上硬拉 32 位系统,debootstrap 可能因缺少 qemu-debootstrap 直接退出,错误信息就一行:E: Cannot install into target after debootstrap.

lxc-attach 进去看不到 /procps报错 “no such file or directory”?

这不是容器坏了,是 lxc-attach 默认不挂载伪文件系统(procsysfsdevpts),它只做 namespace 切换,不模拟完整启动流程。

容器里没有 /procpstoplsmod 全部失效,但 cat /proc/self/status 却能执行成功——因为 LXC 内部已挂了,只是 lxc-attach 没透传。

  • 启动时加 --rcfile 或在容器配置里确保有:lxc.mount.entry = proc proc proc nodev,noexec,nosuid 0 0
  • 更简单的方法:别用 lxc-attach,改用 lxc-console -n <container></container>(需容器内已启 getty)或直接 lxc exec <container> -- /bin/bash</container>(LXC 3.0+ 自动挂载全部伪文件系统)
  • 注意 lxc-attach--clear-env 参数会清空 PATH,导致找不到 bash,错误提示就是 execv: No such file or directory

容器里 ping 不通外网,但 lxc-ls --fancy 显示状态是 RUNNING

RUNNING 只代表 init 进程活着,不等于网络就通。LXC 默认用 lxcbr0 桥接,但这个桥在多数新发行版里已被弃用或未自动创建。

  • 检查桥是否存在:ip link show lxcbr0;不存在就手动建:sudo brctl addbr lxcbr0 && sudo ip addr add 10.0.3.1/24 dev lxcbr0 && sudo ip link set lxcbr0 up
  • 容器配置中必须有:lxc.network.type = veth + lxc.network.link = lxcbr0,缺一不可
  • 宿主机需开启 IP 转发:echo 'net.ipv4.ip_forward=1' | sudo tee -a /etc/sysctl.conf && sudo sysctl -p
  • 如果宿主机用的是 NetworkManager,它可能偷偷接管 lxcbr0 并 down 掉——检查 journalctl -u NetworkManager | grep lxcbr0,真有就加 unmanaged-devices=interface-name:lxcbr0/etc/NetworkManager/NetworkManager.conf

LXC 的坑不在语法,而在它太贴近内核机制:cgroup 版本、网络命名空间隔离粒度、伪文件系统挂载时机,每个点都可能让容器“看起来在跑,其实半身不遂”。调试时别急着重装,先 lxc-info -n <name> -s</name> 看状态,再 lxc-config 查当前生效配置,最后翻 /var/log/lxc/<name>.log</name>——日志里那行带 ERROR 的,往往就是真实断点。

text=ZqhQzanResources