如何用Python生成RSS 2.0 XML Feed

1次阅读

推荐使用xml.etree.elementtree或feedgen;需严格遵循rss 2.0规范,含根节点、及多个

如何用Python生成RSS 2.0 XML Feed

python生成RSS 2.0 XML Feed,推荐使用标准库 xml.etree.ElementTree(轻量、无需额外安装、完全可控),或第三方库 feedgen(更语义化、自动处理转义与验证)。核心是严格遵循 RSS 2.0规范:必须包含 <rss></rss> 根节点(version="2.0"),内嵌一个 <channel></channel>,再在其中添加 <item></item> 条目。

用 xml.etree.ElementTree 手动构建(适合简单定制)

适合对XML结构有明确控制需求、不希望引入依赖的场景。注意:所有文本内容需手动调用 xml.sax.saxutils.escape() 转义,否则特殊字符(如 &)会导致XML无效。

  • 导入模块:import xml.etree.ElementTree as ETfrom xml.sax.saxutils import escape
  • 创建根节点:rss = ET.Element("rss", version="2.0")
  • 添加 channel 及必需子元素:titlelinkdescription(三者均不可为空)
  • 每个 <item></item> 必须含 <title></title><link><description></description>;推荐加上 <pubdate></pubdate>(RFC 2822格式,如 "Wed, 01 Jan 2025 12:00:00 +0000")和 <guid></guid>(唯一标识,建议设 isPermaLink="false"
  • 生成字符串:ET.tostring(rss, encoding="unicode", method="xml"),并添加XML声明 <?xml version="1.0" encoding="UTF-8"?>

用 feedgen 自动生成(推荐新手 & 中等复杂度)

feedgen 封装了RSS/Atom规范细节,自动处理转义、日期格式、XML验证,代码更简洁可读。安装:pip install feedgen

  • 初始化:from feedgen.feed import FeedGeneratorfg = FeedGenerator()
  • 设置 channel 元信息:fg.id("https://example.com")fg.title("My Blog")fg.author({"name": "Alice", "email": "a@example.com"})fg.link(href="https://example.com", rel="alternate")fg.description("A simple RSS feed")
  • 添加条目:fe = fg.add_entry() → 设置 fe.id("https://example.com/post/1")fe.title("Hello World")fe.link(href="https://example.com/post/1")fe.description("First post content")fe.pubdate("2025-01-01T12:00:00Z")(支持 datetime 对象或ISO字符串)
  • 输出:fg.rss_str(pretty=True) 返回带缩进的XML字符串;fg.rss_file("feed.xml") 直接写入文件

关键细节不能忽略

RSS 2.0虽宽松,但以下几点直接影响订阅器兼容性:

立即学习Python免费学习笔记(深入)”;

  • 字符编码必须为 UTF-8,且XML声明中显式标明:<?xml version="1.0" encoding="UTF-8"?>
  • <channel></channel> 下的 <title></title><link><description></description> 是强制字段,不能为空字符串
  • <item></item><title></title><link> 推荐非空;<description></description> 支持HTML标签(如 <p></p><img alt="如何用Python生成RSS 2.0 XML Feed" >),但需确保合法XML(即标签闭合、属性加引号)
  • <pubdate></pubdate> 必须符合 RFC 2822(例如 "Mon, 01 Jan 2024 12:00:00 GMT"),feedgen 会自动转换;手动生成时可用 email.utils.formatdate()
  • HTTP响应头应设为 Content-Type: application/rss+xml; charset=utf-8(若通过Web服务提供)

验证你的Feed是否有效

生成后务必验证。打开 W3C Feed Validation Service,粘贴XML或提交URL。常见报错包括:缺失必填字段、日期格式错误、未转义的 & 符号、XML嵌套不合法。本地调试时,可用 xml.etree.ElementTree.parse() 尝试解析生成的字符串——抛异常说明结构出错。

text=ZqhQzanResources