Hermes AI Agent 的 12 个实用集成工具,每个都附带具体配置步骤

Hermes 单独跑已经有点用了。但把它连到你真正在用的工具上,完全是另一回事。

这个 Agent 自带 20 多个集成,大部分 5 分钟就能配好。问题是没人告诉你哪些值得先开,也不知道开了之后实际长什么样。

我把它们都试了一遍。下面是 12 个真正改变了使用方式的集成,按「回本速度」大概排了个序。

项目地址:NousResearch/hermes-agent

1. Google Workspace(Gmail + 日历 + Drive + Docs + Sheets)

从这开始。认真的。

一个不能查邮件、看日历、拉文档的 Agent,说白了就是个多走了几步的聊天机器人。Google Workspace 让 Hermes 真正知道你的日程里发生了什么。

「帮我查一下周一发给 DataVault 的提案有没有人回复。有的话总结回复内容,明天下午给我排 30 分钟的时间来Review。」

它打开 Gmail 找到邮件线程,读取回复,从 Drive 调出原始提案,写好摘要,然后在日历上创建一个带摘要的事件。一条指令,四个工具联动。
配置步骤: hermes plugins install google-workspace --enable

它会引导你走 OAuth 流程。你需要一个 Google Cloud 项目,开启 Gmail、Calendar 和 Drive API。如果你以前配过 Google API Key,流程一样。没配过的话,第一次大概花 10 分钟。

授权完成后,五个服务(Gmail、日历、Drive、Docs、Sheets)通过一个连接器全部可用。

2. Obsidian

这个集成让我重新思考了自己怎么用笔记。

如果你的知识库、研究笔记或者「第二大脑」放在 Obsidian 里,这个集成把它变成了活着的上下文。笔记库里的每一条笔记、每一个标签、每一个反向链接,Agent 都能搜索、引用和推理。

我的 Obsidian 笔记库里大概有 400 条笔记,涵盖 AI 工具、内容选题、竞品研究和会议记录。集成之前,这些笔记就是躺在硬盘上的文件。现在我可以问 Hermes:「上个月我写的关于Newsletter增长定价策略的内容是什么?和2月份的竞品笔记交叉比对一下,看我的思路还站不站得住。」

它从多条笔记中提取内容,追踪笔记之间的反向链接,综合出一个考虑了我自己都忘了写过的上下文的答案。
配置步骤: 先装 Hermes 端的桥接插件:
hermes plugins install dannyshmueli/obsidian-hermes-console --enable

然后在 Obsidian 里,从「设置 > 社区插件」安装 Hermes Console 社区插件。

在笔记库中创建一个专属的文件夹结构(不要把整个笔记库都开放给 Hermes):
Hermes/ ├── Inbox/ ├── Projects/ ├── Research/ ├── Memory Review/ └── Skill Notes/

两边连好之后,Hermes 首次运行会索引整个笔记库,之后持续监控变更。

3. Firecrawl

大多数网页搜索集成给 Agent 喂的是原始 HTML。这很浪费。模型花 token 去解析标签,而不是真正思考内容。

Firecrawl 返回干净的结构化数据。网页以带元数据的组织化文本形式返回,而不是一堆 div 和 script 标签。响应更快,token 更少,答案更好。

实际用法: 「研究 AI 日程安排领域的 Top 5 竞品。抓取它们的定价页和功能列表,做一个对比表。」

没有 Firecrawl 的话,这意味着去爬五个网站然后祈祷 HTML 能正确解析。有了它,每个页面返回的都是结构化内容,Agent 可以直接拿来推理。对比表一分钟不到就出来了。
配置步骤: Firecrawl 是 Hermes 的默认网页提供商。设置 API Key 后自动生效。从 firecrawl.dev 获取 Key(免费额度很 generous),然后添加:

echo "FIRECRAWL_API_KEY=fc-your-key-here" >> ~/.hermes/.env

完事。不需要装插件。运行 hermes tools 确认网页提供商显示为 Firecrawl 即可。

GitHub:firecrawl/firecrawl · 10 万+ stars

4. Reddit

没有其他集成能给你这么快的、来自真实用户的未经过滤的意见。

产品评测博客都在做 SEO 优化。对比文章里全是联盟链接。Reddit 的帖子里有人在抱怨他们真金白银买过的东西,具体说了哪里出了问题、为什么换了别的。这种信号别的地方拿不到。

实际用法: 「找最近 90 天讨论从 Notion 迁移到 Obsidian 的帖子。Notion 的主要槽点是什么?是什么把人往 Obsidian 推的?」

Hermes 在相关子版块搜索,拉出真实用户体验的帖子,综合出模式。你得到一份基于第一手经验的市场研究,而不是营销文案。
配置步骤: hermes plugins install reddit --enable

需要 Reddit API 凭证(在 reddit.com/prefs/apps 创建应用,类型选 script):

hermes config set reddit.client_id your-client-id
hermes config set reddit.client_secret your-client-secret

5. GitHub

如果你做软件,这个是必开的。

Hermes 获得仓库、Issue、Pull Request 和代码的读取权限。它不再是一个在真空里干活的编程助手,而是一个真正了解代码库长什么样的队友。

实际用法: 「看看前端仓库的开放 Issue。哪些标记为 Bug?哪些挂了超过两周?帮我给这个 Sprint 排个优先级。」

或者从代码角度:「读一下 API 仓库的认证模块,解释 Token 刷新逻辑是怎么工作的。明天要给新来的开发做 Onboarding。」

它拉出实际代码,追踪 import,阅读注释,给你一个基于实际写出来的东西的讲解,而不是你六个月前记忆中写的内容。
配置步骤: hermes plugins install github --enable

生成个人访问 Token(Settings > Developer Settings > Personal Access Tokens > Fine-grained tokens):

hermes config set github.token ghp_your-token-here

至少给 repo 权限。如果要访问 Issue 和 PR,加上对应 Scope。

6. YouTube 字幕

整个集成体系里最被低估的一个。

任何 YouTube 视频都变成可搜索的文本。一小时的播客、技术大会演讲、编程教程、产品演示。全部在几秒内变成索引好的笔记。再也不用在 90 分钟的视频里来回拖动找那 3 分钟的关键内容。

实际用法: 「看这集 Lex Fridman 采访 Andrej Karpathy 的节目,把所有讨论自监督学习的段落挑出来。总结每个论点并标注时间戳。」

粘贴 URL,Hermes 抓取字幕,30 秒内给你一份带时间戳的结构化摘要。用来做日常研究,它已经替代了我整个「稍后观看」播放列表的工作流。
配置步骤: hermes plugins install youtube-transcripts --enable

公开视频不需要 API Key。集成直接从 YouTube 的自动生成字幕拉取字幕。私有或未公开视频需要 YouTube Data API 凭证。

7. Discord

Discord 和频道专属自动化搭配起来才真正强大。

不是一个机器人在所有频道干所有事,而是把 Hermes 接入特定频道,每个频道配专属工作流。客服频道一套行为,内部团队频道另一套,公告频道按自己的节奏跑。

实际用法: 每天早上 8 点,Hermes 扫描客服邮件收件箱(通过 Gmail 集成),按类型和紧急程度分类每张工单,把整理好的摘要发到 #support-triage 频道。紧急问题打标签,重复问题合并。团队任何人打开 Discord 时,收件箱已经分类好了。

另一个配置:#content-ideas 频道里任何消息被 Agent 捕获后,对照我的 Obsidian 笔记库做相关研究,然后把简短的研究摘要作为线程回复发回去。
配置步骤: Discord 通过消息网关连接:

hermes gateway setup

按提示选 Discord。需要在 Discord 开发者门户(discord.com/developers/applications)创建 Bot 并拿到 Token:

hermes config set discord.bot_token your-bot-token
hermes config set discord.channel_ids 123456789,987654321

可以指定 Agent 监听和回复的频道。范围控制好就行,别让它对所有频道的所有消息都做出反应。

8. Stripe

Stripe 有惊人的数据,但锁在一个没人想点进去的面板里。

这个集成把 Stripe 从支付处理器变成可以随便提问的东西。收入、退款、订阅变更、失败扣款、试用转正。全部通过一条指令查询。

实际用法: 「过去 30 天有多少免费试用转正付费了?转化率和上一个 30 天比怎么样?标记本月从 Pro 降级到 Basic 的客户。」

直接给出答案。不需要面板。不需要导出 CSV。不需要为了追踪转化去搭一个自定义的 Stripe Webhook。

我还设了一个每周定时任务,每周一让 Hermes 拉关键收入指标发到 Discord 频道。团队自动收到收入快照,没人碰过 Stripe 面板。
配置步骤: hermes plugins install stripe --enable

从 Stripe 面板拿受限 API Key(Developers > API Keys)。用受限 Key,别用 Secret Key:

hermes config set stripe.api_key rk_live_your-key-here

只授予 charges、subscriptions、customers 和 invoices 的读取权限,别的不要给。

9. InsForge

这个需要多解释几句,因为比较新。

InsForge 是一个开源后端平台,专门为 AI Agent 交互设计。认证、数据库、对象存储、边缘函数,全部放在一个语义层后面。不用串联五个不同服务和管理五个 API 客户端,Agent 和一个接口对话就能搞定一切。

最接近的类比是一个专为 Agent 开发设计的 PaaS。Agent 直接推理后端原语(创建用户、存储文件、查询数据库、运行函数),而不是在断开的 API 之间导航。在 Claude Sonnet 4.6 下,它比 Supabase 少用 2.4 倍的 Token,任务完成速度快 1.27 倍。

实际用法: 「建一个新的用户表,包含邮箱、名字和订阅等级。创建一个边缘函数,每次有新用户注册时自动发欢迎邮件。把邮件模板存在对象存储里。」

一条指令触达认证、数据库、存储和边缘函数。没有 InsForge 的话,你要配置 Supabase + S3 + 无服务器函数 + 邮件 API,每个都有自己的凭证和 SDK。
配置步骤: InsForge 同时提供 MCP 服务器和 CLI Skill:

hermes plugins install insforge --enable
hermes config set insforge.api_key your-insforge-key
hermes config set insforge.project_id your-project-id

GitHub:InsForge/InsForge · 10.5K stars

10. Graphiti(Zep 出品)

从「找相似文本」升级到「理解事物之间的真实关系」。

大多数 AI 工具用向量相似度做知识检索。你问一个问题,系统找出语义相近的文本片段喂给模型。简单查找还行。但一旦答案依赖实体之间的关系而不仅仅是相似度,向量搜索就彻底不够用了。

Graphiti 从对话和文档中实时构建知识图谱。实体之间有类型化的连接。人和公司相连,项目和截止日期相连,决策和做出决策的会议相连。Agent 遍历结构化的关系,而不是靠嵌入向量瞎猜。

实际用法: 「谁把我们引荐给 Acme Corp 团队的?我们什么时候第一次讨论合作的?上次会议他们提到的阻碍因素是什么?」

向量搜索会返回提到「Acme Corp」的文本片段。Graphiti 遍历图谱:人员节点 > 引荐事件 > 公司节点 > 会议节点 > 阻碍因素实体。答案有结构,因为数据本身就有结构。
配置步骤: Graphiti 需要 Neo4j 做图谱后端:

docker run -d -p 7474:7474 -p 7687:7687 neo4j:latest
hermes plugins install graphiti --enable
hermes config set graphiti.neo4j_uri bolt://localhost:7687
hermes config set graphiti.zep_api_key your-zep-key

GitHub:getzep/graphiti

11. Bland(或 Twilio)

给 Hermes 一个真实的声音,用来打真正的电话。

预订座位、确认预约、跟进逾期账单、从名单里做外呼。Agent 处理对话,通话录音会被记录下来供你回顾。

实际用法: 「给本周注册 Demo 的 15 个潜在客户打电话。确认他们偏好的时间段,问问对定价有没有问题,把回复记录下来。」

Hermes 拨打电话,处理对话流程,记录每条回复,最后给你一个汇总。说实话,前几次听通话录音本身就挺有意思的。
配置步骤(Bland): hermes plugins install bland --enable
hermes config set bland.api_key your-bland-key
配置步骤(Twilio 替代方案): hermes plugins install twilio --enable
hermes config set twilio.account_sid your-sid
hermes config set twilio.auth_token your-token
hermes config set twilio.phone_number +1234567890

12. Fireflies

每场会议录音,全部可以通过自然语言搜索。

如果你已经在用 Fireflies 录会议,这个集成让录音可以查询。不用在 45 分钟的录音里来回拖动找某个人说了什么,直接问就行。

实际用法: 「上周四和客户的通话里,他们对定价说了什么?提到预算数字了吗?」

即时回答。从实际录音文字中提取。附带相关引用和时间戳。

我把它和 Discord 集成搭配使用,每天把面向客户的会议摘要发到私有频道。销售团队不用听完录音就能拿到会议要点。
配置步骤: hermes plugins install fireflies --enable
hermes config set fireflies.api_key your-fireflies-key

注意:Fireflies 需要 Business 套餐才有 API 访问权限。免费和 Pro 套餐不开放 API。

推荐的配置顺序

从零开始的话,按这个顺序来:

  1. Google Workspace(邮件、日历、文档一次搞定)
  2. Firecrawl(就是一个环境变量,对任何网页研究任务立竿见影)
  3. Obsidian 或你的笔记应用(给 Agent 你的个人知识库)
  4. GitHub(如果你写代码)或 Stripe(如果你做生意)
  5. YouTube 字幕(公开视频不需要 API Key,价值立现)
  6. Discord(等你有了值得自动化的工作流再开)
  7. 其余根据具体需求加

别第一天就把 12 个全开了。先开 2 到 3 个匹配你最常用任务的,让 Agent 围绕这些工作流建立记忆,等使用模式清晰了再加。