跳转至

20. Nous Tool Gateway + Fast Mode

Part A · Nous Tool Gateway(v0.10 主推)

心智模型:订阅代替 N 个 API key

graph TB
    subgraph "传统用法(v0.8)"
        K1[OpenAI Key]
        K2[Firecrawl Key]
        K3[FAL Key]
        K4[ElevenLabs Key]
        K5[Browserbase Key]
        K6[...]
    end

    subgraph "v0.10 Tool Gateway"
        NP[Nous Portal 订阅]
        NP --> T1[web_search ✓]
        NP --> T2[image_generation ✓]
        NP --> T3[tts ✓]
        NP --> T4[browser_use ✓]
    end

    style NP fill:#FFD700,color:#000

简单讲:不自己买 Firecrawl / FAL / ElevenLabs 等 key。月付 Nous Portal 订阅,Hermes 通过 Portal 的 API 代你调用这些工具。


谁适合用

  • 你已经 / 打算订阅 Nous Portal(模型本身值这个钱)
  • 不想管理一堆 API key + 发票
  • 团队 / 多人使用,要统一账单
  • 新手,想快速有全套工具
  • 用量大到单买每个工具更便宜
  • 需要特定工具的高级功能(比如 FAL 特定模型,Portal 不一定有)
  • 不订阅 Portal 的个人免费用户

账本估算(参考)

工具 单独买 通过 Portal(订阅含)
Firecrawl web search $49 / 月起 免费(订阅内)
FAL 图像 500 次 $20-50 免费
ElevenLabs TTS 100k 字符 $22 免费
Browserbase 1000 会话 $29 免费
合计 $120+ Portal 订阅(通常 $20-50)

前提:你真的在用这些工具。只用模型不用工具,就不划算。


最小实践:启用 Tool Gateway

Step 1 · 确认 Portal 订阅

portal.nousresearch.com 看订阅状态。

Step 2 · 切到 Nous Portal 模型

hermes model
# 选 Nous Portal
# Hermes 自动检测到你是订阅用户,弹出 Tool Gateway 开关

或手动:

hermes config set tools.use_gateway.web_search true
hermes config set tools.use_gateway.image_generation true
hermes config set tools.use_gateway.tts true
hermes config set tools.use_gateway.browser_use true

Step 3 · 验证

hermes doctor

相关工具那行应该显示:

[✓] web_search (via Nous Tool Gateway)
[✓] image_generation (via Nous Tool Gateway)
[✓] tts (via Nous Tool Gateway)
[✓] browser_use (via Nous Tool Gateway)

Gateway 的工作机制

sequenceDiagram
    participant A as Hermes Agent
    participant G as Tool Gateway
    participant NP as Nous Portal
    participant T as 第三方服务

    A->>G: 调用 web_search
    G->>G: 判断:有 use_gateway 配置吗?
    alt 有 Gateway
        G->>NP: 用 Nous API key 转发
        NP->>T: Firecrawl 查询
        T-->>NP: 结果
        NP-->>G: 结果 + 计入订阅
        G-->>A: 返回
    else 没 Gateway
        G->>T: 用你自己的 FIRECRAWL_API_KEY
        T-->>G: 结果
        G-->>A: 返回
    end

关键:即使你同时有自己的 Firecrawl key(.env 里)和gateway 启用,Hermes 优先走 gateway(除非你关了)。

按工具细粒度控制:

tools:
  use_gateway:
    web_search: true        # Firecrawl 走 gateway
    image_generation: false # FAL 用你自己的 key
    tts: true               # OpenAI TTS 走 gateway
    browser_use: true       # Browserbase 走 gateway

省心模式 vs 掌控模式

tools:
  use_gateway:
    web_search: true
    image_generation: true
    tts: true
    browser_use: true
不买任何 API key,订阅搞定一切。

tools:
  use_gateway:
    web_search: true           # 偶尔搜,gateway 够
    image_generation: false    # 重度用图,自己买 FAL 企业版更划算
    tts: false                 # 需要特定 voice,自买 ElevenLabs
    browser_use: true          # 偶尔用,gateway 够
混搭 —— 哪些用 gateway、哪些自买,完全你自己定。


Part B · Fast Mode(/fast,v0.9 新增)

心智模型:多付一点,插队快过

graph LR
    subgraph "标准队列"
        Q1[请求] --> S1[等待...]
        S1 --> R1[响应<br/>3-10 秒]
    end

    subgraph "Fast Mode(优先队列)"
        Q2[请求] --> S2[短等待]
        S2 --> R2[响应<br/>0.5-2 秒]
    end

    style R1 fill:#FFA07A,color:#000
    style R2 fill:#98FB98,color:#000

支持: - OpenAI Priority Processing 系列(GPT-5.4、Codex 等) - Anthropic Fast Tier(Claude 3.x / 4.x 某些模型)

代价: - 每次调用更贵(OpenAI 标价每 token ×2,Anthropic ×1.5 左右)

不支持: - 其他 provider(OpenRouter 转发不支持;国产模型没有对应机制) - 本地 / 自托管模型


用法

> /fast
✓ Fast Mode enabled. Next turn will use priority processing.

> 帮我把这段代码重构
[ 响应明显比平时快 ]

> /fast off
✓ Fast Mode disabled.
hermes --fast
hermes config set fast_mode.enabled true

什么时候值

场景 开 Fast Mode?
面试 / 演示 / 直播
开会中,别人等你
聊天式 UX(用户盯着)
写代码 pair programming
后台 cron 任务
长时间独立工作
批量任务
夜间 / 周末挂跑

原则:人在等就值,人不等就不值


真实延迟对比(示例数据)

模型 标准延迟 Fast 延迟 价格倍数
GPT-5.4 Priority ~4s ~1.2s 2.0×
Claude Opus 4.7 Fast ~8s ~2s 1.5×
Claude Sonnet 4.6 Fast ~3s ~0.8s 1.5×

实际延迟受太多因素影响

上表仅供参考。受: - 输入 token 数量(长 context 慢) - 输出 token 数量(thinking 模型更慢) - 时区 / 负载 / 节假日 - 你的网络


Fast Mode 的坑

坑 1 · 不支持的模型切进去报错

现象:你切到 DeepSeek 然后 /fast,报 "not supported by provider"。

对策:Fast Mode 只对支持它的模型有效。用不上的时候直接 /fast off

坑 2 · 计费没料到

现象:月底看账单 Fast Mode 占了大头。

对策:用 /usage 随时看累计。长期高频用的话,考虑换用量方案(OpenAI 企业版、Anthropic Team 计划)。

坑 3 · Fast ≠ 更准

Fast Mode 只改变队列优先级,不改模型能力。如果你要的是更准的答案,切更大模型,而不是 Fast Mode。


两个功能的搭配用法

典型高效配置:

# ~/.hermes/config.yaml

default_model: claude-sonnet-4-6

# 聊天时默认 Fast
fast_mode:
  enabled: true
  auto_disable_for:      # 这些场景自动关 Fast
    - cron               # cron 不需要快,省钱
    - background         # 后台任务不急

# Tool Gateway 全开
tools:
  use_gateway:
    web_search: true
    image_generation: true
    tts: true
    browser_use: true

一起省心:订阅解决工具 key,Fast 解决延迟。


下一章:21. 安全权限 + 插件系统 →