Python restrictedpython 的安全执行环境

2次阅读

restrictedpython 不能直接运行 eval()/exec(),因其在ast编译阶段重写并拦截危险操作,仅支持python 3.7–3.11语法子集,需用 compile_restricted() 编译并显式配置白名单globals。

Python restrictedpython 的安全执行环境

为什么 RestrictedPython 不能直接跑 eval()exec()

它不是给普通代码加个沙箱就完事的——RestrictedPython 是在编译阶段(AST 层)重写并拦截危险操作,所以你写的代码必须能被它解析+改写。一旦用了不支持的语法(比如 await:=match),或者调用了没显式白名单的内置函数,就会直接报错,而不是运行时拒绝。

常见错误现象:SyntaxError: invalid syntax(遇到海象运算符)、NameError: name 'print' is not defined(没注入 print)、RuntimeError: restricted statement: import(写了 import 却没配 allowed_modules)。

  • 只支持 Python 3.7–3.11 的语法子集,3.12+ 的新特性基本不认
  • 所有变量访问、函数调用、属性获取都会被重写成带检查的 wrapper,所以性能比原生低 3–5 倍是常态
  • 不能靠“删掉危险函数”来补救,必须从编译入口就用 compile_restricted() 替代 compile()

怎么让 printlenrange 这些基础功能可用

它们默认全被砍掉——RestrictedPython 的哲学是“白名单即一切”,连 NoneTrue 都得手动塞进去。

实操建议:用 compile_restricted() 编译后,再通过 exec() 执行时传入一个严格构造的 globals 字典:

立即学习Python免费学习笔记(深入)”;

from RestrictedPython import compile_restricted <p>code = "print(len([1, 2, 3]))" bytecode = compile_restricted(code)</p><h1>必须显式提供这些</h1><p>safe_globals = { "<strong>builtins</strong>": { "print": print, "len": len, "range": range, "list": list, "dict": dict, "None": None, "True": True, "False": False, } }</p><p>exec(bytecode, safe_globals)
  • __builtins__ 是唯一入口,不能叫 __builtin__(少个 s 就失效)
  • 别把整个 builtins 模块塞进去,否则 openexec 全复活
  • 如果要用 json.loads,得先 import json 到 outer scope,再把它放进 safe_globals

import 能放开吗?怎么安全地支持第三方模块

默认禁止所有 import,连 from math import sin 都会报 restricted statement: import。想开,得两级放行:编译时允许 import 语句 + 运行时限定可导入模块。

实操建议:用 compile_restricted()allowed_modules 参数声明白名单,再在 exec()globals 中预置模块引用:

code = "from math import sin; print(sin(0))" bytecode = compile_restricted(     code,     allowed_modules=["math"]  # ← 编译期许可 ) <p>safe_globals = { "<strong>builtins</strong>": {"print": print}, "math": <strong>import</strong>("math")  # ← 运行时提供 } exec(bytecode, safe_globals)
  • allowed_modules 只接受模块名字符串列表,不支持通配符或路径
  • 如果模块有 C 扩展(如 numpy),大概率加载失败——RestrictedPython 不处理 __getattr__ 或动态属性链
  • 别试图在代码里写 __import__,它本身不在白名单里,且会被 AST 重写器直接干掉

为什么你的用户代码总在 getattr__getitem__ 上崩溃

因为 RestrictedPython 把所有点号访问(a.b)、下标访问(a[0])、调用(f())都转成了对 getattrgetitemcall 等内置函数的调用——而这些函数默认不在 __builtins__ 白名单里。

典型错误:NameError: name 'getattr' is not defined,哪怕你没写 getattr,只是写了 obj.attr 就会触发。

  • 必须在 __builtins__ 中显式加入 getattrhasattrgetitemcalliter 等,否则任何对象属性/方法访问都失败
  • 这些函数本身不危险,但它们的参数可能指向危险对象,所以你要确保传进来的对象(比如 obj)是你自己构造并审查过的
  • 如果用户代码需要遍历字典,除了 iter,还得提供 nextStopIteration 异常类,否则 for k in d: 直接崩

事情说清了就结束。最麻烦的从来不是语法限制,而是你得亲手把每个隐式触发的底层操作都列进白名单——漏一个,用户代码就卡在最意想不到的地方。

text=ZqhQzanResources