20. Nous Tool Gateway + Fast Mode¶
Part A · Nous Tool Gateway(v0.10 主推)¶
心智模型:订阅代替 N 个 API key¶
graph TB
subgraph "传统用法(v0.8)"
K1[OpenAI Key]
K2[Firecrawl Key]
K3[FAL Key]
K4[ElevenLabs Key]
K5[Browserbase Key]
K6[...]
end
subgraph "v0.10 Tool Gateway"
NP[Nous Portal 订阅]
NP --> T1[web_search ✓]
NP --> T2[image_generation ✓]
NP --> T3[tts ✓]
NP --> T4[browser_use ✓]
end
style NP fill:#FFD700,color:#000
简单讲:不自己买 Firecrawl / FAL / ElevenLabs 等 key。月付 Nous Portal 订阅,Hermes 通过 Portal 的 API 代你调用这些工具。
谁适合用¶
- 你已经 / 打算订阅 Nous Portal(模型本身值这个钱)
- 不想管理一堆 API key + 发票
- 团队 / 多人使用,要统一账单
- 新手,想快速有全套工具
- 用量大到单买每个工具更便宜
- 需要特定工具的高级功能(比如 FAL 特定模型,Portal 不一定有)
- 不订阅 Portal 的个人免费用户
账本估算(参考)¶
| 工具 | 单独买 | 通过 Portal(订阅含) |
|---|---|---|
| Firecrawl web search | $49 / 月起 | 免费(订阅内) |
| FAL 图像 500 次 | $20-50 | 免费 |
| ElevenLabs TTS 100k 字符 | $22 | 免费 |
| Browserbase 1000 会话 | $29 | 免费 |
| 合计 | $120+ | Portal 订阅(通常 $20-50) |
前提:你真的在用这些工具。只用模型不用工具,就不划算。
最小实践:启用 Tool Gateway¶
Step 1 · 确认 Portal 订阅
portal.nousresearch.com 看订阅状态。
Step 2 · 切到 Nous Portal 模型
或手动:
hermes config set tools.use_gateway.web_search true
hermes config set tools.use_gateway.image_generation true
hermes config set tools.use_gateway.tts true
hermes config set tools.use_gateway.browser_use true
Step 3 · 验证
相关工具那行应该显示:
[✓] web_search (via Nous Tool Gateway)
[✓] image_generation (via Nous Tool Gateway)
[✓] tts (via Nous Tool Gateway)
[✓] browser_use (via Nous Tool Gateway)
Gateway 的工作机制¶
sequenceDiagram
participant A as Hermes Agent
participant G as Tool Gateway
participant NP as Nous Portal
participant T as 第三方服务
A->>G: 调用 web_search
G->>G: 判断:有 use_gateway 配置吗?
alt 有 Gateway
G->>NP: 用 Nous API key 转发
NP->>T: Firecrawl 查询
T-->>NP: 结果
NP-->>G: 结果 + 计入订阅
G-->>A: 返回
else 没 Gateway
G->>T: 用你自己的 FIRECRAWL_API_KEY
T-->>G: 结果
G-->>A: 返回
end
关键:即使你同时有自己的 Firecrawl key(.env 里)和gateway 启用,Hermes 优先走 gateway(除非你关了)。
想按工具细粒度控制:
tools:
use_gateway:
web_search: true # Firecrawl 走 gateway
image_generation: false # FAL 用你自己的 key
tts: true # OpenAI TTS 走 gateway
browser_use: true # Browserbase 走 gateway
省心模式 vs 掌控模式¶
Part B · Fast Mode(/fast,v0.9 新增)¶
心智模型:多付一点,插队快过¶
graph LR
subgraph "标准队列"
Q1[请求] --> S1[等待...]
S1 --> R1[响应<br/>3-10 秒]
end
subgraph "Fast Mode(优先队列)"
Q2[请求] --> S2[短等待]
S2 --> R2[响应<br/>0.5-2 秒]
end
style R1 fill:#FFA07A,color:#000
style R2 fill:#98FB98,color:#000
支持: - OpenAI Priority Processing 系列(GPT-5.4、Codex 等) - Anthropic Fast Tier(Claude 3.x / 4.x 某些模型)
代价: - 每次调用更贵(OpenAI 标价每 token ×2,Anthropic ×1.5 左右)
不支持: - 其他 provider(OpenRouter 转发不支持;国产模型没有对应机制) - 本地 / 自托管模型
用法¶
什么时候值¶
| 场景 | 开 Fast Mode? |
|---|---|
| 面试 / 演示 / 直播 | ✓ |
| 开会中,别人等你 | ✓ |
| 聊天式 UX(用户盯着) | ✓ |
| 写代码 pair programming | ✓ |
| 后台 cron 任务 | ✗ |
| 长时间独立工作 | ✗ |
| 批量任务 | ✗ |
| 夜间 / 周末挂跑 | ✗ |
原则:人在等就值,人不等就不值。
真实延迟对比(示例数据)¶
| 模型 | 标准延迟 | Fast 延迟 | 价格倍数 |
|---|---|---|---|
| GPT-5.4 Priority | ~4s | ~1.2s | 2.0× |
| Claude Opus 4.7 Fast | ~8s | ~2s | 1.5× |
| Claude Sonnet 4.6 Fast | ~3s | ~0.8s | 1.5× |
实际延迟受太多因素影响
上表仅供参考。受: - 输入 token 数量(长 context 慢) - 输出 token 数量(thinking 模型更慢) - 时区 / 负载 / 节假日 - 你的网络
Fast Mode 的坑¶
坑 1 · 不支持的模型切进去报错¶
现象:你切到 DeepSeek 然后 /fast,报 "not supported by provider"。
对策:Fast Mode 只对支持它的模型有效。用不上的时候直接 /fast off。
坑 2 · 计费没料到¶
现象:月底看账单 Fast Mode 占了大头。
对策:用 /usage 随时看累计。长期高频用的话,考虑换用量方案(OpenAI 企业版、Anthropic Team 计划)。
坑 3 · Fast ≠ 更准¶
Fast Mode 只改变队列优先级,不改模型能力。如果你要的是更准的答案,切更大模型,而不是 Fast Mode。
两个功能的搭配用法¶
典型高效配置:
# ~/.hermes/config.yaml
default_model: claude-sonnet-4-6
# 聊天时默认 Fast
fast_mode:
enabled: true
auto_disable_for: # 这些场景自动关 Fast
- cron # cron 不需要快,省钱
- background # 后台任务不急
# Tool Gateway 全开
tools:
use_gateway:
web_search: true
image_generation: true
tts: true
browser_use: true
一起省心:订阅解决工具 key,Fast 解决延迟。