用go构建新闻聚合服务的核心是抓得稳、排得清、展得快:通过goroutine并发抓取RSS/atom源,mmcdole/gofeed健壮解析,统一NewsItem结构并按时间倒序排序,net/http+html/template轻量渲染,定时更新与职责分离设计确保高并发下稳定高效。

用 Go 构建新闻聚合服务,核心是“抓得稳、排得清、展得快”。它不依赖复杂框架,靠标准库 + 少量成熟包就能跑起来,适合学习高并发处理和数据流编排。
抓取 RSS/Atom 源要健壮
真实环境里,源站可能超时、返回 503、xml 格式不规范,甚至字段缺失。不能一请求失败就停摆。
- 用 mmcdole/gofeed 解析,它自动适配 RSS 2.0、Atom 1.0、jsONFeed,省去手动写 XML 结构体的麻烦
- 每个源单独 goroutine 抓取,避免一个源卡住拖慢全部;加 timeout(如 10s) 和简单重试(最多 2 次)
- 发布时间优先用
item.PublishedParsed, fallback 到item.UpdatedParsed或当前时间,保证排序有依据
聚合与排序需轻量可控
聚合不是简单拼接,而是统一结构、去重、按时间倒序——这是用户看到“最新”新闻的前提。
- 定义统一的 NewsItem 结构体,含 Title、Link、Date、Source 字段,屏蔽不同源的字段差异
- 所有抓取结果存进一个切片,用 sort.Slice 按 Date 降序排列,不用引入额外排序库
- 如需去重,可对 Link 做 map[String]bool 记录,抓到已存在链接时跳过(注意内存增长,小项目够用)
服务暴露要简洁可靠
不需要上完整 Web 框架,net/http + html/template 足够支撑首页展示,且启动快、资源省。
立即学习“go语言免费学习笔记(深入)”;
- 模板中用
{{.Title}}、{{.Source}}渲染,支持简单样式和跳转,避免 JS 渲染复杂度 - 用 goroutine 启动定时抓取(比如每 10 分钟),主 goroutine 专注 HTTP 服务,职责分离
- 监听
:8080即可,生产环境前加反向代理(如 nginx)处理 https 和静态资源
基本上就这些。代码不到 100 行,但涵盖了并发采集、结构标准化、时间排序、模板渲染四个关键环节,是理解 Go 数据聚合逻辑的典型入口。