郭震 AI公众号:郭震AI

3 Hermes智能体模型配置与第一次对话

📅发表日期: 2026-05-17

🏷️分类: Hermes智能体

👁️阅读次数: 0

安装 Hermes 只是第一步。真正决定体验的,是你给它配置什么模型。智能体任务比普通聊天更吃上下文、工具调用能力和稳定性,所以不要随便拿一个很小的模型就开始跑复杂任务。

1. 运行模型配置向导

在终端执行:

hermes model

这个命令会进入交互式配置流程,让你选择模型提供商、认证方式和默认模型。

你也可以运行完整向导:

hermes setup

但如果你已经安装完成,只想先让模型可用,hermes model 更直接。

2. 如何选择模型提供商

Hermes 支持很多提供商。新手可以按使用场景选择:

场景 推荐方向
想最快跑通 OpenAI、Anthropic、Nous Portal、OpenRouter
想用国内模型 DeepSeek、Kimi、Qwen、智谱 GLM
想统一路由多个模型 OpenRouter、Hugging Face
想私有化或本地模型 Ollama、vLLM、SGLang 等兼容 OpenAI 的端点
想做代码任务 选择编码能力强、上下文长、工具调用稳定的模型

Hermes 官方快速入门里特别提醒:模型上下文至少需要 64K tokens。原因很简单,智能体执行任务时不只是回答一句话,它要保留计划、工具输出、文件片段、错误信息和历史上下文。

3. 配置 OpenRouter 示例

如果你想通过 OpenRouter 调用多个模型,可以按向导选择 OpenRouter,然后输入 API Key。

也可以用配置命令:

hermes config set OPENROUTER_API_KEY sk-or-...

然后运行:

hermes model

选择你要使用的模型。

4. 配置 DeepSeek 示例

如果你希望直接使用 DeepSeek API,可以在 hermes model 中选择 DeepSeek 相关提供商,然后按提示填写 API Key。

也可以先写入环境变量:

hermes config set DEEPSEEK_API_KEY sk-...

再运行:

hermes model

注意:不同提供商的模型名、上下文长度和计费方式可能变化,实际以向导展示和官方控制台为准。

5. 配置本地模型示例

如果你用 Ollama、本地 vLLM 或 SGLang,通常可以走“自定义兼容 OpenAI 的端点”。

以 Ollama 为例,先确保本地服务在运行:

ollama serve

再运行:

hermes model

选择自定义端点,填入类似:

http://localhost:11434/v1

模型名填写你本地实际拉取的模型。

本地模型要特别注意上下文长度。如果模型上下文太小,Hermes 可能直接拒绝启动,或者在复杂任务里很快丢上下文。

6. 第一次启动 Hermes

模型配置完成后,运行:

hermes

或者使用 TUI:

hermes --tui

第一次不要给它一个太大的任务。建议从可验证的小任务开始:

总结当前目录下这个项目的用途,告诉我主入口文件可能在哪里。

或者:

检查当前目录,列出最值得我先阅读的 5 个文件,并说明原因。

如果 Hermes 能正确读取目录、返回文件信息,并且没有认证错误,说明基础闭环已经跑通。

7. 验证会话恢复

结束会话后,测试恢复:

hermes --continue

或者简写:

hermes -c

如果能回到上一轮会话,说明会话保存正常。后续使用智能体做长期任务时,这点非常重要。

8. 常用斜杠命令

进入 Hermes 后,输入 / 可以看到命令提示。常用命令包括:

命令 作用
/help 查看帮助
/tools 查看或切换工具
/model 切换模型
/new 开启新会话
/reset 重置当前会话
/retry 重试上一轮
/undo 撤销上一轮
/usage 查看上下文使用情况

如果任务跑偏,直接输入新消息即可打断当前方向;在 CLI 中也可以用 Ctrl+C

9. 判断是否配置成功

配置成功通常有 4 个标志:

  • 启动时能看到当前模型和提供商。
  • Hermes 可以正常回复,不再提示 API Key 缺失。
  • 它能使用基本工具,例如读取目录或文件。
  • 多轮对话能保持上下文。

如果失败,按这个顺序排查:

hermes doctor
hermes model
hermes setup
hermes sessions list
hermes --continue

10. 本节小结

模型配置是 Hermes 上手的关键。新手先保证一个模型稳定可用,再去叠加工具、Docker、MCP、消息平台和自动化。只要第一次真实对话跑通,后面的学习就会轻松很多。

💬 评论

暂无评论