
本文介绍在 pydantic v2 中,如何将形如 `[[1, “red“], [2, “blue”]]` 的二维列表自动转换为结构化模型(如 `item(id: int, color: str)`),并通过 `@model_validator(mode=”before”)` 实现灵活、健壮的自定义解析。
在实际 API 开发或数据集成场景中,后端返回的 jsON 响应有时并不遵循标准字段命名规范——例如,data 字段可能直接是一个二维列表(如 [[id, color], …]),而非对象数组(如 [{“id”: 1, “color”: “red”}, …])。此时若直接用 Pydantic 的默认解析机制,会因类型不匹配而报错:Expected list[Item], got list[list]。
解决该问题的核心思路是:在模型实例化前,对原始输入数据进行预处理。Pydantic v2 提供了 @model_validator(mode=”before”) 装饰器,允许我们在字段值被验证和类型转换前,介入并重写其结构。
以下是一个完整、可运行的示例:
from datetime import datetime from pydantic import BaseModel, model_validator # 原始响应数据(模拟服务器返回) data = { "date": "2024-02-05 15:34:44", "status": True, "data": [ [1, "red"], [2, "blue"], [3, "yellow"] ] } class Item(BaseModel): id: int color: str @model_validator(mode="before") @classmethod def from_list(cls, values): # 当输入是长度为 2 的列表时,映射为字段字典 if isinstance(values, list) and len(values) == 2: return {"id": values[0], "color": values[1]} # 否则保持原样,交由默认验证器处理(支持 dict 输入) return values class Model(BaseModel): date: datetime status: bool data: list[Item] # 反序列化成功! result = Model(**data) print(result) # 输出:date=datetime.datetime(2024, 2, 5, 15, 34, 44) status=True data=[Item(id=1, color='red'), ...]
✅ 关键要点说明:
- @model_validator(mode=”before”) 在字段值进入类型校验前触发,适用于结构转换;
- isinstance(values, list) and len(values) == 2 是安全判断,避免误处理合法字典输入;
- 支持多源兼容:该 Item 模型既能解析 [1, “red”],也能解析 {“id”: 1, “color”: “red”};
- 若列表格式不固定(如含额外字段),可在 from_list 中扩展逻辑(如解包到 *args 或按索引取值);
- ⚠️ 注意:datetime 字段依赖字符串格式匹配(此处 “yyYY-MM-DD HH:MM:SS” 符合默认解析规则;若格式不同,需配合 @field_validator 或 json_encoders 处理)。
这种方案简洁、可维护性强,无需引入额外依赖或手动遍历转换,是处理非标准 json 结构与 Pydantic 模型对齐的推荐实践。