Hermes 单独跑已经有点用了。但把它连到你真正在用的工具上,完全是另一回事。
这个 Agent 自带 20 多个集成,大部分 5 分钟就能配好。问题是没人告诉你哪些值得先开,也不知道开了之后实际长什么样。
我把它们都试了一遍。下面是 12 个真正改变了使用方式的集成,按「回本速度」大概排了个序。
项目地址:NousResearch/hermes-agent
1. Google Workspace(Gmail + 日历 + Drive + Docs + Sheets)
从这开始。认真的。
一个不能查邮件、看日历、拉文档的 Agent,说白了就是个多走了几步的聊天机器人。Google Workspace 让 Hermes 真正知道你的日程里发生了什么。
它打开 Gmail 找到邮件线程,读取回复,从 Drive 调出原始提案,写好摘要,然后在日历上创建一个带摘要的事件。一条指令,四个工具联动。
hermes plugins install google-workspace --enable它会引导你走 OAuth 流程。你需要一个 Google Cloud 项目,开启 Gmail、Calendar 和 Drive API。如果你以前配过 Google API Key,流程一样。没配过的话,第一次大概花 10 分钟。
授权完成后,五个服务(Gmail、日历、Drive、Docs、Sheets)通过一个连接器全部可用。
2. Obsidian
这个集成让我重新思考了自己怎么用笔记。
如果你的知识库、研究笔记或者「第二大脑」放在 Obsidian 里,这个集成把它变成了活着的上下文。笔记库里的每一条笔记、每一个标签、每一个反向链接,Agent 都能搜索、引用和推理。
它从多条笔记中提取内容,追踪笔记之间的反向链接,综合出一个考虑了我自己都忘了写过的上下文的答案。
hermes plugins install dannyshmueli/obsidian-hermes-console --enable然后在 Obsidian 里,从「设置 > 社区插件」安装 Hermes Console 社区插件。
在笔记库中创建一个专属的文件夹结构(不要把整个笔记库都开放给 Hermes):
两边连好之后,Hermes 首次运行会索引整个笔记库,之后持续监控变更。
3. Firecrawl
大多数网页搜索集成给 Agent 喂的是原始 HTML。这很浪费。模型花 token 去解析标签,而不是真正思考内容。
Firecrawl 返回干净的结构化数据。网页以带元数据的组织化文本形式返回,而不是一堆 div 和 script 标签。响应更快,token 更少,答案更好。
没有 Firecrawl 的话,这意味着去爬五个网站然后祈祷 HTML 能正确解析。有了它,每个页面返回的都是结构化内容,Agent 可以直接拿来推理。对比表一分钟不到就出来了。
firecrawl.dev 获取 Key(免费额度很 generous),然后添加:echo "FIRECRAWL_API_KEY=fc-your-key-here" >> ~/.hermes/.env完事。不需要装插件。运行
hermes tools 确认网页提供商显示为 Firecrawl 即可。GitHub:
firecrawl/firecrawl · 10 万+ stars4. Reddit
没有其他集成能给你这么快的、来自真实用户的未经过滤的意见。
产品评测博客都在做 SEO 优化。对比文章里全是联盟链接。Reddit 的帖子里有人在抱怨他们真金白银买过的东西,具体说了哪里出了问题、为什么换了别的。这种信号别的地方拿不到。
Hermes 在相关子版块搜索,拉出真实用户体验的帖子,综合出模式。你得到一份基于第一手经验的市场研究,而不是营销文案。
hermes plugins install reddit --enable需要 Reddit API 凭证(在
reddit.com/prefs/apps 创建应用,类型选 script):hermes config set reddit.client_id your-client-idhermes config set reddit.client_secret your-client-secret5. GitHub
如果你做软件,这个是必开的。
Hermes 获得仓库、Issue、Pull Request 和代码的读取权限。它不再是一个在真空里干活的编程助手,而是一个真正了解代码库长什么样的队友。
或者从代码角度:「读一下 API 仓库的认证模块,解释 Token 刷新逻辑是怎么工作的。明天要给新来的开发做 Onboarding。」
它拉出实际代码,追踪 import,阅读注释,给你一个基于实际写出来的东西的讲解,而不是你六个月前记忆中写的内容。
hermes plugins install github --enable生成个人访问 Token(Settings > Developer Settings > Personal Access Tokens > Fine-grained tokens):
hermes config set github.token ghp_your-token-here至少给 repo 权限。如果要访问 Issue 和 PR,加上对应 Scope。
6. YouTube 字幕
整个集成体系里最被低估的一个。
任何 YouTube 视频都变成可搜索的文本。一小时的播客、技术大会演讲、编程教程、产品演示。全部在几秒内变成索引好的笔记。再也不用在 90 分钟的视频里来回拖动找那 3 分钟的关键内容。
粘贴 URL,Hermes 抓取字幕,30 秒内给你一份带时间戳的结构化摘要。用来做日常研究,它已经替代了我整个「稍后观看」播放列表的工作流。
hermes plugins install youtube-transcripts --enable公开视频不需要 API Key。集成直接从 YouTube 的自动生成字幕拉取字幕。私有或未公开视频需要 YouTube Data API 凭证。
7. Discord
Discord 和频道专属自动化搭配起来才真正强大。
不是一个机器人在所有频道干所有事,而是把 Hermes 接入特定频道,每个频道配专属工作流。客服频道一套行为,内部团队频道另一套,公告频道按自己的节奏跑。
另一个配置:#content-ideas 频道里任何消息被 Agent 捕获后,对照我的 Obsidian 笔记库做相关研究,然后把简短的研究摘要作为线程回复发回去。
hermes gateway setup按提示选 Discord。需要在 Discord 开发者门户(
discord.com/developers/applications)创建 Bot 并拿到 Token:hermes config set discord.bot_token your-bot-tokenhermes config set discord.channel_ids 123456789,987654321可以指定 Agent 监听和回复的频道。范围控制好就行,别让它对所有频道的所有消息都做出反应。
8. Stripe
Stripe 有惊人的数据,但锁在一个没人想点进去的面板里。
这个集成把 Stripe 从支付处理器变成可以随便提问的东西。收入、退款、订阅变更、失败扣款、试用转正。全部通过一条指令查询。
直接给出答案。不需要面板。不需要导出 CSV。不需要为了追踪转化去搭一个自定义的 Stripe Webhook。
我还设了一个每周定时任务,每周一让 Hermes 拉关键收入指标发到 Discord 频道。团队自动收到收入快照,没人碰过 Stripe 面板。
hermes plugins install stripe --enable从 Stripe 面板拿受限 API Key(Developers > API Keys)。用受限 Key,别用 Secret Key:
hermes config set stripe.api_key rk_live_your-key-here只授予 charges、subscriptions、customers 和 invoices 的读取权限,别的不要给。
9. InsForge
这个需要多解释几句,因为比较新。
InsForge 是一个开源后端平台,专门为 AI Agent 交互设计。认证、数据库、对象存储、边缘函数,全部放在一个语义层后面。不用串联五个不同服务和管理五个 API 客户端,Agent 和一个接口对话就能搞定一切。
最接近的类比是一个专为 Agent 开发设计的 PaaS。Agent 直接推理后端原语(创建用户、存储文件、查询数据库、运行函数),而不是在断开的 API 之间导航。在 Claude Sonnet 4.6 下,它比 Supabase 少用 2.4 倍的 Token,任务完成速度快 1.27 倍。
一条指令触达认证、数据库、存储和边缘函数。没有 InsForge 的话,你要配置 Supabase + S3 + 无服务器函数 + 邮件 API,每个都有自己的凭证和 SDK。
hermes plugins install insforge --enablehermes config set insforge.api_key your-insforge-keyhermes config set insforge.project_id your-project-idGitHub:
InsForge/InsForge · 10.5K stars10. Graphiti(Zep 出品)
从「找相似文本」升级到「理解事物之间的真实关系」。
大多数 AI 工具用向量相似度做知识检索。你问一个问题,系统找出语义相近的文本片段喂给模型。简单查找还行。但一旦答案依赖实体之间的关系而不仅仅是相似度,向量搜索就彻底不够用了。
Graphiti 从对话和文档中实时构建知识图谱。实体之间有类型化的连接。人和公司相连,项目和截止日期相连,决策和做出决策的会议相连。Agent 遍历结构化的关系,而不是靠嵌入向量瞎猜。
向量搜索会返回提到「Acme Corp」的文本片段。Graphiti 遍历图谱:人员节点 > 引荐事件 > 公司节点 > 会议节点 > 阻碍因素实体。答案有结构,因为数据本身就有结构。
docker run -d -p 7474:7474 -p 7687:7687 neo4j:latesthermes plugins install graphiti --enablehermes config set graphiti.neo4j_uri bolt://localhost:7687hermes config set graphiti.zep_api_key your-zep-keyGitHub:
getzep/graphiti11. Bland(或 Twilio)
给 Hermes 一个真实的声音,用来打真正的电话。
预订座位、确认预约、跟进逾期账单、从名单里做外呼。Agent 处理对话,通话录音会被记录下来供你回顾。
Hermes 拨打电话,处理对话流程,记录每条回复,最后给你一个汇总。说实话,前几次听通话录音本身就挺有意思的。
hermes plugins install bland --enablehermes config set bland.api_key your-bland-keyhermes plugins install twilio --enablehermes config set twilio.account_sid your-sidhermes config set twilio.auth_token your-tokenhermes config set twilio.phone_number +123456789012. Fireflies
每场会议录音,全部可以通过自然语言搜索。
如果你已经在用 Fireflies 录会议,这个集成让录音可以查询。不用在 45 分钟的录音里来回拖动找某个人说了什么,直接问就行。
即时回答。从实际录音文字中提取。附带相关引用和时间戳。
我把它和 Discord 集成搭配使用,每天把面向客户的会议摘要发到私有频道。销售团队不用听完录音就能拿到会议要点。
hermes plugins install fireflies --enablehermes config set fireflies.api_key your-fireflies-key注意:Fireflies 需要 Business 套餐才有 API 访问权限。免费和 Pro 套餐不开放 API。
推荐的配置顺序
从零开始的话,按这个顺序来:
- Google Workspace(邮件、日历、文档一次搞定)
- Firecrawl(就是一个环境变量,对任何网页研究任务立竿见影)
- Obsidian 或你的笔记应用(给 Agent 你的个人知识库)
- GitHub(如果你写代码)或 Stripe(如果你做生意)
- YouTube 字幕(公开视频不需要 API Key,价值立现)
- Discord(等你有了值得自动化的工作流再开)
- 其余根据具体需求加
别第一天就把 12 个全开了。先开 2 到 3 个匹配你最常用任务的,让 Agent 围绕这些工作流建立记忆,等使用模式清晰了再加。