Qdrant Python SDK 中日期时间过滤的正确实现方法

2次阅读

qdrant 当前版本（v1.7.x 及更早）不支持直接使用 datetime 对象进行范围过滤，需将时间转换为 unix 时间戳（整型秒或毫秒）后，通过 range 过滤器进行数值比较。

qdrant 当前版本（v1.7.x 及更早）不支持直接使用 datetime 对象进行范围过滤，需将时间转换为 unix 时间戳（整型秒或毫秒）后，通过 range 过滤器进行数值比较。

在 Qdrant 中，所有字段过滤均基于底层存储的数据类型，而时间戳字段（如 “timestamp”）在向量点（point）元数据中必须以数值形式（int 或 Float）存储，才能被 range 过滤器正确解析。直接传入 python 的 datetime 对象会导致类型校验失败，抛出类似 input should be a valid number 的 Pydantic 错误。

✅ 正确做法是：统一使用 Unix 时间戳（毫秒级整数）表示时间，并确保写入与查询时类型一致。

1. 写入数据时：将 datetime 转为毫秒时间戳

from datetime import datetime from qdrant_client import QdrantClient from qdrant_client.models import PointStruct, Payload  # 示例：构造带时间戳的点 dt = datetime(2024, 2, 22, 10, 4, 28, 658690) timestamp_ms = int(dt.timestamp() * 1000)  # 转为毫秒级整数（推荐，精度更高）  point = PointStruct(     id=1,     vector=[0.1, 0.2, 0.3],     payload={         "text": "log entry",         "timestamp": timestamp_ms  # ✅ 存为 int     } )  qdrant_client = QdrantClient("http://localhost:6333") qdrant_client.upsert(Collection_name="logs", points=[point])

2. 查询时：同样使用毫秒时间戳构建 range 过滤器

from datetime import datetime  # 构造查询起始时间 start_dt = datetime(2024, 2, 22, 10, 0, 0) start_ts_ms = int(start_dt.timestamp() * 1000)  # 构建过滤查询（gte: 大于等于该时间） query_filter = {     "bool": {         "filter": [             {                 "range": {                     "timestamp": {"gte": start_ts_ms}                 }             }         ]     } }  # 执行向量搜索（带过滤） search_result = qdrant_client.search(     collection_name="logs",     query_vector=[0.1, 0.2, 0.3],     query_filter=query_filter,     limit=10 )

⚠️ 关键注意事项

单位一致性：务必统一使用「毫秒」（推荐）或「秒」，但不能混用；Qdrant 本身无时间单位概念，仅做数值比较。
字段类型预设：确保 collection schema 中 timestamp 字段未被错误声明为 String；若使用 create_collection，无需显式声明基础类型（Qdrant 自动推断），但 payload 中值必须为 int/float。
时区处理：datetime.timestamp() 默认基于本地时区转换；如需 UTC 时间，请使用 datetime.utcnow().timestamp() 或更安全的 datetime.now(timezone.utc).timestamp()（Python 3.9+）。
未来兼容性：Qdrant v1.8.0 将原生支持 datetime 类型字段及 ISO 格式字符串过滤（如 “2024-02-22T10:04:28.658Z”），但当前稳定版仍需手动转换。

✅ 总结

只要坚持「写入用毫秒整数、查询用毫秒整数」这一原则，即可在现有 Qdrant 版本中稳健实现高精度时间范围过滤。该方案性能优异、零依赖、完全兼容 SDK 各版本，是生产环境中的标准实践。

发表于：后端开发

近一天内

复制链接

c++如何实现链表反转_c++链表操作算法【源码】

PHP中substr()失效？揭秘字符串截取的常见陷阱与正确解法

如何在 Go 中严格校验十六进制字符串长度并解析为 uint8

如何防止用户通过直接 URL 访问敏感上传文件

Linux sar / iostat / vmstat / mpstat 的性能监控组合使用模板

Qdrant Python SDK 中日期时间过滤的正确实现方法

1. 写入数据时：将 datetime 转为毫秒时间戳

2. 查询时：同样使用毫秒时间戳构建 range 过滤器

⚠️ 关键注意事项

✅ 总结

Go语言中高效顺序调用多个方法并统一处理返回值与错误的正确实践

CSS项目实战之代码块高亮展示_内边距、背景与字体设置

Composer如何忽略某些文件不被自动加载？（exclude用法）

PHP隐错后怎快速开临时调试_PHP临时开调试技巧【应急】

JWT 编码错误：JWT::encode() 方法缺少算法参数的解决方案

C++怎么使用标准输入输出_C++cin cout教程【基础】

Echarts加载XML数据 Echarts图表如何使用XML数据源

CSS框架Milligram实战_极简主义下的前端开发快速原型

C# 文件系统命名空间 C#在Linux中如何使用Namespace隔离文件系统视图

composer如何在GitHub Codespaces中预装依赖？（devcontainer配置示例）