cat README.md
Agent-Reach
给 AI Agent 装上互联网眼睛——16+ 平台零 API 费用,一句话安装,Cookie 本地存储不上传。Twitter、小红书、B站、微信公众号、抖音、Reddit、YouTube、微博、V2EX、雪球……全给 Agent 开了后门。
// 目录
// 概览
// 痛点:AI Agent 的"信息孤岛"困局
我每天用 Claude Code 跑 GitHub AI 日报,流程已经跑了一个多月了。但有个事情一直让我头疼——Agent 想看社交媒体内容,基本上是瞎的。
你说让它搜个 Twitter 上的讨论?对不起,X 的 API 现在要 $100/月起步。小红书的热门笔记?没有官方 API,爬虫写一套还得天天维护反爬。B站视频讲了什么?手动复制字幕再喂给它?Reddit 2024 年开始强制认证,裸访问直接 403。微信公众号更别提了,搜都搜不了。
所以每次 Agent 需要互联网数据的时候,我只能自己手动去各平台找内容,复制粘贴喂给它。一个"自动化"工作流硬是被社交媒体的围墙花园打回了手动时代。
直到我看见 Agent-Reach 上了 Trending,一句话介绍就把我抓住了:"给 AI Agent 一键装上互联网能力,零 API 费用"。
// 架构:脚手架,不是框架
这点挺关键的,Agent-Reach 把自己定位成脚手架(Scaffold)而不是框架。什么意思呢?它不包装业务逻辑,不搞中间层,只负责三件事:
1. 装好上游工具——yt-dlp 处理视频字幕、twitter-cli 读写推文、rdt-cli 访问 Reddit、xhs-cli 操作小红书、gh CLI 跑 GitHub……每个平台一个专用 CLI 工具,全是开源方案。
2. 配好环境——安装依赖、配置搜索引擎、检测本地/服务器环境差异,全部自动化。
3. 注册 SKILL.md——往 Agent 的 skills 目录里写一份"说明书",让 Agent 知道"搜 Twitter 该调 twitter-cli"、"读视频字幕该用 yt-dlp"。以后 Agent 遇到这类需求,自己就知道该调哪个工具,不用你教。
Agent 直接调用上游工具,数据不经过 Agent-Reach 的包装层。这个设计其实挺聪明的——不用维护一套统一的 API 抽象,上游工具更新了直接跟就行,每个渠道可以独立替换。
// 架构流程
// 平台覆盖:16+ 渠道全拆解
我仔细过了一遍每个渠道的实现,按"装好即用"和"需配置"分了类。
装好即用(零配置)
这 7 个渠道是真正的"装完就能跑"——网页用 Jina Reader(9.8K Star)转 Markdown,YouTube用 yt-dlp(154K Star)提取字幕,RSS用 feedparser 解析,GitHub公开仓库用 gh CLI 直接读。微信公众号靠 Exa 搜索 + Camoufox 渲染全文 Markdown,微博热搜和搜索直接可用,V2EX热门和节点内容也是裸跑。
说实话这几个零配置渠道已经覆盖了我 80% 的日常需求。尤其是微信公众号那个,我之前做公众号内容调研,要么手动搜要么用第三方工具,现在直接让 Agent 搜完读全文,省了一大截时间。
需配置(Cookie 或认证)
剩下的 9 个渠道需要一些前置操作,但都不复杂。核心流程就是浏览器登录 → Cookie-Editor 插件导出 → 发给 Agent。Twitter 用 twitter-cli(2.1K Star),小红书用 xhs-cli(1.5K Star),Reddit 用 rdt-cli(304 Star)跑 rdt login 自动提取浏览器 Cookie。抖音走 douyin-mcp-server 解析视频。LinkedIn 用 linkedin-scraper-mcp(1.2K Star)。雪球和小宇宙播客也各有专用方案。
这里有个重要提醒——用 Cookie 登录的平台有封号风险。作者反复强调建议用小号,这个不是开玩笑的。Twitter 查异常登录挺严的,小红书更不用说。我自己是专门开了个 Twitter 小号来测,大号不敢冒险。
全网搜索
还有个 Exa 语义搜索引擎,通过 MCP 接入,免费不要 Key。这个跟传统关键词搜索不一样,能理解你"想搜什么"而不是"字面匹配什么"。搭配微信公众号搜索一起用,做内容调研的时候效果不错。
// 安装使用
安装方式是我见过最省事的——一句话发给你的 AI Agent:
安装过程会自动完成:装 agent-reach CLI → 装系统依赖(Node.js、gh CLI、mcporter、twitter-cli、rdt-cli 等)→ 配置 Exa 搜索引擎 → 检测环境 → 注册 SKILL.md 到 Agent skills 目录。
装完之后,你不需要记任何命令。直接跟 Agent 说"帮我看看这条推文"、"搜一下小红书上关于 XX 的笔记"、"这个 B站视频讲了什么",Agent 自己会去 SKILL.md 里找到对应的工具来调用。
有个细节值得提——agent-reach doctor 诊断命令,跑一遍就能看到所有渠道的可用状态,哪个没配好会直接告诉你怎么修。这种"自检 + 修复建议"的设计,比那些装完就不管的项目友好多了。
// 竞品对比
| 方案 | 平台覆盖 | 费用 | 核心优势 | 核心短板 |
|---|---|---|---|---|
| Agent-Reach | 16+(含小红书/微信公众号/微博/V2EX/雪球/抖音) | $0 | 中文平台覆盖最全 + 零 API 费 + 可插拔替换上游 | Cookie 登录有封号风险 + 无统一 API 抽象 + 依赖上游工具稳定性 |
| 各平台官方 API | 单一平台 | $100+/月 | 稳定 + 合规 + 功能完整 | 贵 + 每个平台单独对接 + Twitter/Reddit API 门槛高 |
| Firecrawl / Crawl4AI | 通用网页 | 免费~$19/月 | 网页爬取专业 + JS 渲染 | 只做网页 + 不覆盖社交媒体 + 不处理登录态 |
| Browser-Use / Playwright Agent | 全平台(浏览器自动化) | 免费 | 什么网站都能操作 | 重 + 慢 + 维护成本高 + 反爬容易被检测 + 不稳定 |
| Exa / Tavily / SerpAPI | 全网搜索 | 免费额度~$50/月 | 搜索质量高 + 接入简单 | 只能搜不能读 + 超额要付费 + 不覆盖社交媒体详情 |
// 平台配置成本
// 博主观点
聊几个我觉得值得说的事。
第一,这东西解决的是一个真实的痛点。我跑 GitHub AI 日报一个多月,最烦的就是 Agent 看不了社交媒体。每次需要补充"社区怎么看这个项目"的信息,都得自己手动去 Twitter、Reddit、小红书找。Agent-Reach 把这个环节打通了,光微信公众号零配置搜索这一个功能,对我来说就已经值了。
第二,脚手架定位是对的。如果它要做统一 API 抽象层,16+ 平台的差异性能把它拖死。现在这种"我只负责装好工具和写说明书"的方式,维护成本最低,扩展性也最强——上游工具挂了换一个就行,不用改 Agent-Reach 的代码。
第三,Cookie 路线是双刃剑。好处是零成本,坏处是随时可能被平台封。Twitter 已经在查异常 Cookie 使用了,小红书的反爬也在加严。作者建议用小号,但这只能降低风险不能消除。如果你是用在商业场景,这一点要认真评估。
第四,中文平台覆盖是真正的差异化。对比市面上的竞品——Firecrawl/Crawl4AI 只做网页,Browser-Use 走浏览器自动化路线(重且不稳定),Exa/Tavily 只能搜不能读。Agent-Reach 是目前唯一一个把微信公众号、小红书、微博、V2EX、雪球、B站、抖音这些国内平台做成一等公民的开源方案。
但短板也很明显。没有统一 API 意味着每个渠道的调用方式不一样(有的走 CLI、有的走 MCP),Agent 需要 SKILL.md 来"学习"怎么用,不像 Firecrawl 那样一个 scrape(url) 搞定所有网页。另外,所有数据获取都依赖上游工具的稳定性——twitter-cli 挂了 Twitter 就废了,rdt-cli 不更新 Reddit 就 403,你自己没法修。项目也只有 4 个 Release、249 Commits,更新频率不算高。v1.4.0 是 3 月 31 号的,到现在两个多月没出新版了。
总的来说,Agent-Reach 目前是 AI Agent 互联网能力赛道里"覆盖面最广 + 成本最低"的方案,尤其适合做内容调研和个人自动化工作流。但如果你要上生产环境或者有合规要求,Cookie 路线的风险需要单独评估。
✅ 完全零 API 费用,7 个平台装好即用
✅ 脚手架设计,维护成本低,可插拔替换上游工具
✅ agent-reach doctor 自检 + 修复建议
✅ SKILL.md 一次注册,Agent 自动知道怎么调
✅ MIT 开源,Cookie 仅本地存储不上传
❌ 无统一 API 抽象,每个渠道调用方式不同
❌ 上游工具挂了就废了,自己修不了
❌ 更新频率偏低(v1.4.0 后两月未更新)
❌ 4 个 Release 太少,项目成熟度待验证
❌ 没有性能 Benchmark 和可靠度数据