两小时把 AI Agent 部署到自己的服务器:Hermes Agent 上手教程
这篇文章记录一次从 0 部署 Hermes Agent 的过程:安装、配置模型 API、启动命令行助手,并解释为什么 AI Agent 需要稳定的 token。

过去一年,很多人都在聊 AI Agent。
但说实话,如果你只是打开一个网页和 ChatGPT 对话,那还不算真正用上 Agent。真正有意思的是:它能不能帮你读文件、改代码、执行命令、浏览网页、定时跑任务,甚至接到 Telegram、微信、QQ 群里变成一个长期在线的助手。
我最近在折腾的是 Hermes Agent。
它的定位有点像 Claude Code、OpenClaw、小龙虾这类工具:不是单纯聊天,而是让大模型真的接触你的工作环境,帮你完成任务。
这篇文章先不讲太复杂的玩法,只做一件事:
从 0 开始,在服务器上把 Hermes Agent 跑起来。
如果你跟着走完,最后会得到一个能在终端里工作的 AI Agent。后面再继续接 Telegram、微信、QQ 群、定时任务、自动运维和代码助手。

AI Agent 和普通聊天机器人有什么区别?
普通聊天机器人更像一个“问答窗口”。
你问一句,它答一句。它不知道你的电脑上有什么文件,也不能帮你执行命令。你让它改代码,它最多给你一段建议,真正复制、运行、测试,还是你自己来。
AI Agent 不太一样。
一个能用的 Agent 至少应该能做这些事:
- 读取项目文件
- 修改代码
- 执行 shell 命令
- 搜索资料
- 调用浏览器
- 运行测试
- 记住你的偏好
- 在聊天软件里响应你
- 定时执行任务
这也是 Hermes Agent 比较有意思的地方。它不是一个单纯的聊天壳,而是一个可以接入工具、文件系统、终端和消息平台的 Agent 框架。
你可以把它理解成:
给大模型装上手和脚。
为什么我要把它部署到服务器?
本地当然也能跑,但服务器有几个明显好处。
第一,它可以长期在线。
如果你后面要把 Hermes 接到 Telegram、微信、QQ 群,或者让它每天定时总结新闻、检查服务器状态,本地电脑就不太适合。电脑关机,Agent 也就没了。
第二,服务器更适合做自动化任务。
比如:
- 每天早上 9 点发一份 AI 行业简报
- 每晚自动总结群聊
- 监控网站状态
- 发现服务挂了就提醒你
- 帮你定时跑脚本
- 远程帮你查日志
第三,服务器环境更干净。
你可以专门给 Agent 准备一台小机器,里面只放它需要的东西。出了问题也好排查。
准备工作
这篇文章默认你已经有一台 Linux 服务器。
最低配置不用太高,普通云服务器就行。建议:
- 系统:Ubuntu 22.04 / 24.04,Debian 也可以
- 内存:至少 2GB,建议 4GB 起
- 磁盘:10GB 以上
- 网络:能访问模型 API
- 权限:最好有 root 或 sudo 权限
你还需要一个模型 API Key。
Hermes Agent 本身不提供大模型,它需要连接 OpenAI、Claude、OpenRouter、DeepSeek、Gemini 或其他兼容 OpenAI 格式的 API 服务。
如果你懒得分别注册一堆模型平台,也可以用统一 API token 站点。比如我自己会用:
这类平台的好处是:一个 token 可以接入多个模型,很多开源项目只需要填 Base URL、API Key 和模型名就能跑起来。对新手来说,省事很多。
第一步:安装 Hermes Agent
登录服务器后,执行:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
安装完成后,重新加载 shell 环境,或者直接重新登录一次服务器。
然后检查命令是否可用:
hermes --version
如果能看到版本号,说明安装成功。
第二步:运行初始化配置
第一次使用建议直接跑配置向导:
hermes setup
它会让你配置模型、provider、工具等内容。
如果你用的是 OpenAI、Anthropic、OpenRouter 这类官方支持的 provider,可以按向导一路填。
如果你用的是兼容 OpenAI 格式的 API 站点,比如 Nbility,一般需要关注三个东西:
Base URL
API Key
Model Name
具体值以你自己的控制台为准。
一般来说,兼容 OpenAI 的服务会长得像这样:
Base URL: https://你的-api-地址/v1
API Key: sk-xxxxxxxxxxxxxxxx
Model: 你要使用的模型名称
注意:不要把真实 API Key 发到公开文章、截图或者群里。
第三步:检查环境是否正常
配置完成后,执行:
hermes doctor
这个命令会检查 Hermes 的依赖、配置、模型连接等状态。
如果你看到明显的报错,优先检查这几类问题:
- API Key 填错
- Base URL 少了
/v1 - 模型名不存在
- 服务器网络无法访问 API
- 余额不足
- provider 配置不匹配
如果是 token 或模型 API 的问题,可以先去你的 API 控制台看一下请求日志和余额。
第四步:启动 Hermes Agent
最简单的启动方式就是:
hermes
启动后,你会进入一个交互式命令行聊天界面。
你可以先问它一个简单问题:
你现在可以做什么?
然后试试更像 Agent 的任务:
帮我查看当前目录下有哪些文件,并解释这个项目大概是做什么的。
如果 Hermes 有终端和文件工具权限,它就可以真正去读目录、看文件,而不是凭空猜。
这一步很关键。
因为这时候你已经不是在用一个网页聊天机器人了,而是在用一个能接触系统环境的 AI Agent。

第五步:试一个真实任务
别只问“你好”这种问题。
Agent 好不好用,要看它能不能完成具体任务。
你可以试试这些:
帮我检查这个服务器的系统信息,包括 CPU、内存、磁盘和当前运行的进程。
或者:
帮我写一个 Python 脚本,每 10 分钟检查一次某个网站是否能访问,如果失败就输出错误日志。
再或者,如果你在一个项目目录里:
请阅读这个项目的 README 和 package 配置,告诉我如何启动本地开发环境。
如果它能读文件、执行命令、总结结果,说明基础能力已经通了。
为什么 AI Agent 会消耗更多 token?
很多新手第一次跑 Agent,会发现 token 消耗比普通聊天更快。
这是正常的。
因为 Agent 不是简单回答一句话。它通常会经历这个过程:
- 理解你的任务
- 查看当前环境
- 读取文件
- 分析输出
- 决定下一步
- 调用工具
- 再读取结果
- 继续推理
- 最后给你总结
每一步都会产生上下文。
如果它在帮你看一个代码项目,可能会读 README、配置文件、源码、测试文件、日志。读得越多,上下文越长,token 消耗就越高。
所以如果你准备长期使用 Hermes、OpenClaw、Dify、LobeChat、NextChat 这类工具,一个稳定的模型 API token 基本是刚需。
你当然可以直接用 OpenAI、Anthropic、OpenRouter 等官方或第三方平台。也可以用统一 token 站点,比如:
我的建议是:刚开始别纠结太多,先找一个兼容 OpenAI API 的服务,把 Agent 跑起来。等你真的用起来了,再根据任务选择更便宜或更强的模型。
推荐的新手模型选择思路
如果你只是刚开始测试,不建议一上来就用最贵的模型。
可以按任务分:
普通聊天、总结、改简单配置:
用便宜模型
写代码、查 bug、读项目:
用中等或偏强的模型
复杂重构、长上下文分析、多步骤 Agent 任务:
用强模型
Agent 的核心不是“每次都用最贵的模型”,而是根据任务选合适的模型。
一个比较现实的组合是:
- 日常问答:便宜模型
- 代码任务:强一点的模型
- 长文档分析:长上下文模型
- 图像生成:专门的图像模型
如果你的 API 平台支持多模型切换,会方便很多。
常见问题
1. hermes 命令找不到
可能是环境变量没有刷新。
重新登录服务器,或者检查安装脚本输出里提示的 PATH 配置。
也可以试试:
which hermes
看系统能不能找到它。
2. 模型连接失败
优先检查:
hermes doctor
然后确认:
- API Key 是否正确
- Base URL 是否正确
- 模型名是否正确
- 账户是否还有余额
- 服务器能不能访问 API 地址
很多问题其实不是 Hermes 的问题,而是 API 配置填错了。
3. Agent 为什么会执行命令?
因为这正是 Agent 和普通聊天机器人的区别。
不过也要注意安全。不要随便给陌生模型完全不受限制的服务器权限,尤其是生产服务器。
建议新手一开始在测试机、轻量服务器或容器环境里玩。
4. 可以接 Telegram、微信、QQ 吗?
可以。
Hermes Agent 支持多种消息平台。后面的文章我会继续写:
- 如何把 Hermes 接到 Telegram
- 如何把 Hermes 接到微信
- 如何把 Hermes 接到 QQ 群
- 如何做群聊自动总结
- 如何让它帮你监控网站和服务器
部署到服务器只是第一步。真正好玩的部分在后面。
这一篇先做到这里
到这里,你已经完成了最基础的 Hermes Agent 部署:
- 安装 Hermes
- 完成初始化配置
- 配好模型 API
- 通过
hermes doctor检查环境 - 在终端里启动 AI Agent
- 试着让它读取环境、执行任务
这已经比普通网页聊天前进了一大步。
下一篇我会继续写:
Hermes Agent 如何接入 Nbility:Base URL、API Key、模型名应该怎么填?
如果你也想跟着搭,可以先准备一个模型 API token。
我自己用的是:
它适合这类开源 AI 应用的测试和部署。尤其是 Hermes、OpenClaw、Dify、LobeChat、NextChat 这种需要 OpenAI 兼容接口的项目,填好 API 地址和 token 基本就能开始跑。
可选短版摘要
如果平台需要摘要,可以用这一段:
这篇文章记录了一次从 0 部署 Hermes Agent 的过程。相比普通聊天机器人,AI Agent 可以读取文件、执行命令、调用工具并完成多步骤任务。文章介绍了服务器准备、安装命令、初始化配置、模型 API 设置、常见问题,以及为什么 Agent 类应用会持续消耗 token。适合想入门 AI Agent、Hermes Agent、OpenAI 兼容 API 和自动化助手部署的新手。


