Python生成RSS Feed XML 使用feedgen库创建订阅源

6次阅读

feedgen生成rss不被识别的根本原因是默认缺失rss根节点的version和xmlns属性，需显式调用fg.rss_version(‘2.0’)并添加atom_link；entry.id必须是全局唯一不可变字符串，推荐用url或内容哈希；输出时须统一utf-8编码并设置正确content-type；万级条目性能差，应限制条数、预生成并缓存。

feedgen 生成的 RSS XML 不被浏览器或阅读器识别

根本原因是 feedgen 默认不设置必需的命名空间和根元素属性，很多 RSS 阅读器（比如 Feedly、Inoreader）会直接拒绝解析。浏览器地址栏打开 XML 文件时显示“无法显示此页面”，往往不是格式错，而是 rss 根节点缺 version 和 xmlns。

实操上必须显式调用 rss_str() 前配置好版本与命名空间：

fg = FeedGenerator() 创建后立刻执行 fg.rss_version('2.0')
不要依赖默认行为——fg.rss_str() 内部不会自动补 xmlns:atom，需手动加：fg.atom_link(href='https://example.com/feed.xml', rel='self')
确保 fg.title()、fg.link(href=...)、fg.description() 全部非空，三项缺失任一，部分阅读器会静默丢弃整个 feed

添加条目时 `entry.guid` 被忽略或重复导致聚合器去重失败

RSS 的 guid 是阅读器判断新旧条目的唯一依据，feedgen 中它不叫 guid，而是 id 字段，且必须是字符串类型、全局唯一、不可变。

常见错误是把时间戳或数据库自增 ID 直接塞进 entry.id()：

立即学习“Python免费学习笔记（深入）”；

用 datetime.now().isoformat() 生成的值每次运行都不同 → 同一篇内容反复出现在订阅源里
用 str(post.id) 但未保证跨环境唯一（比如多实例部署时 ID 冲突）→ 阅读器认为是不同文章，实际却是重复内容
正确做法：对原文 URL 或内容哈希取值，例如 entry.id(hashlib.md5(post.url.encode()).hexdigest())

中文标题/描述乱码或被截断

feedgen 本身支持 UTF-8，但问题出在输出环节：如果用 print(fg.rss_str()) 或写入文件时不指定编码，python 默认用系统 locale 编码（windows 上常是 cp936），XML 声明却写着 <?xml version="1.0" encoding="UTF-8"?>，造成解析器按 UTF-8 解、实际内容却是 GBK 编码 → 乱码或解析失败。

务必统一编码出口：

写文件时明确用 open(... , encoding='utf-8')，不能省略 encoding 参数
Web 框架中返回响应时，设好 Content-Type: application/rss+xml; charset=utf-8，django/flask 都要额外加 content_type 参数
避免用 fg.rss_str().encode('utf-8') 再 decode 回字符串——多余转换可能引入 bom 或损坏结构

性能差：万级条目生成耗时几十秒

feedgen 设计目标是灵活性，不是高性能批量生成。它内部对每个 entry 做完整 XML 元素构建 + 属性校验，1000 条目通常 1–2 秒；到 10000 条时可能突破 30 秒，CPU 占满。

真实场景下，RSS 只需要最新 N 条（比如 50 或 100），不需要全量历史：

入库或拉取数据时就按时间倒序取前 N 条，别把全部数据传给 feedgen
完全不用 feedgen？用模板字符串拼接更轻量：f'<item><title>{escape(title)}</title>...</item>'，配合 xml.sax.saxutils.escape() 防 xss 即可满足基础需求
若必须动态生成且条目数固定，考虑缓存整个 XML 字符串，用文件或 redis 存，更新频率低时 TTL 设 5 分钟足够

feedgen 的价值在字段丰富性和标准兼容性，不在吞吐量。真要撑住高并发 RSS 请求，得靠预生成 + CDN 缓存，而不是优化单次调用。

发表于：数据库

五天前

复制链接

C++ map operator[]陷阱 C++访问不存在key自动插入问题【注意】

mysql锁和事务如何协同处理复制

mysql如何批量导入多个sql文件_mysql批量导入多个sql文件的操作指南

mysql如何优化in语句查询

composer怎么配置http-basic多源认证_composer多个私有仓库凭证【管理】

Python生成RSS Feed XML 使用feedgen库创建订阅源

feedgen 生成的 RSS XML 不被浏览器或阅读器识别

添加条目时 `entry.guid` 被忽略或重复导致聚合器去重失败

中文标题/描述乱码或被截断

性能差：万级条目生成耗时几十秒

Laravel 中使用集合 zip 方法实现多字段字符串并行拆分

css布局如何制作响应式表格_使用overflow-x和百分比列宽

kubectl命令怎么输出YAML为XML格式

Sublime怎么连服务器 Sublime怎么使用SFTP同步代码【远程】

CSS水平对齐方式_text-align属性在不同布局中的表现

CSS如何制作具有深度感的悬浮提升效果_通过transition配合translateY和阴影

CSS如何实现响应式的图片卡片_利用百分比margin保持比例

CSS如何实现具有响应式间距的流式网格_利用百分比gap或calc计算css间距

sublime如何配置Assembly汇编语言高亮环境？（底层开发）

CSS如何利用浮动制作简单的标签云_通过设置不同步长的float元素css

Python生成RSS Feed XML 使用feedgen库创建订阅源

feedgen 生成的 RSS XML 不被浏览器或阅读器识别

添加条目时 entry.guid 被忽略或重复导致聚合器去重失败

中文标题/描述乱码或被截断

性能差：万级条目生成耗时几十秒

添加条目时 `entry.guid` 被忽略或重复导致聚合器去重失败