AI AgentHermes Agent大模型 APINbility服务器部署

两小时把 AI Agent 部署到自己的服务器:Hermes Agent 上手教程

这篇文章记录一次从 0 部署 Hermes Agent 的过程:安装、配置模型 API、启动命令行助手,并解释为什么 AI Agent 需要稳定的 token。

两小时把 AI Agent 部署到自己的服务器:Hermes Agent 上手教程

过去一年,很多人都在聊 AI Agent。

但说实话,如果你只是打开一个网页和 ChatGPT 对话,那还不算真正用上 Agent。真正有意思的是:它能不能帮你读文件、改代码、执行命令、浏览网页、定时跑任务,甚至接到 Telegram、微信、QQ 群里变成一个长期在线的助手。

我最近在折腾的是 Hermes Agent

它的定位有点像 Claude Code、OpenClaw、小龙虾这类工具:不是单纯聊天,而是让大模型真的接触你的工作环境,帮你完成任务。

这篇文章先不讲太复杂的玩法,只做一件事:

从 0 开始,在服务器上把 Hermes Agent 跑起来。

如果你跟着走完,最后会得到一个能在终端里工作的 AI Agent。后面再继续接 Telegram、微信、QQ 群、定时任务、自动运维和代码助手。


封面图:niku 在服务器机房里介绍 Hermes Agent,旁边有终端窗口和 API token 面板


AI Agent 和普通聊天机器人有什么区别?

普通聊天机器人更像一个“问答窗口”。

你问一句,它答一句。它不知道你的电脑上有什么文件,也不能帮你执行命令。你让它改代码,它最多给你一段建议,真正复制、运行、测试,还是你自己来。

AI Agent 不太一样。

一个能用的 Agent 至少应该能做这些事:

  • 读取项目文件
  • 修改代码
  • 执行 shell 命令
  • 搜索资料
  • 调用浏览器
  • 运行测试
  • 记住你的偏好
  • 在聊天软件里响应你
  • 定时执行任务

这也是 Hermes Agent 比较有意思的地方。它不是一个单纯的聊天壳,而是一个可以接入工具、文件系统、终端和消息平台的 Agent 框架。

你可以把它理解成:

给大模型装上手和脚。

普通聊天机器人 vs AI Agent 对比图


为什么我要把它部署到服务器?

本地当然也能跑,但服务器有几个明显好处。

第一,它可以长期在线。

如果你后面要把 Hermes 接到 Telegram、微信、QQ 群,或者让它每天定时总结新闻、检查服务器状态,本地电脑就不太适合。电脑关机,Agent 也就没了。

第二,服务器更适合做自动化任务。

比如:

  • 每天早上 9 点发一份 AI 行业简报
  • 每晚自动总结群聊
  • 监控网站状态
  • 发现服务挂了就提醒你
  • 帮你定时跑脚本
  • 远程帮你查日志

第三,服务器环境更干净。

你可以专门给 Agent 准备一台小机器,里面只放它需要的东西。出了问题也好排查。


准备工作

这篇文章默认你已经有一台 Linux 服务器。

最低配置不用太高,普通云服务器就行。建议:

  • 系统:Ubuntu 22.04 / 24.04,Debian 也可以
  • 内存:至少 2GB,建议 4GB 起
  • 磁盘:10GB 以上
  • 网络:能访问模型 API
  • 权限:最好有 root 或 sudo 权限

你还需要一个模型 API Key。

Hermes Agent 本身不提供大模型,它需要连接 OpenAI、Claude、OpenRouter、DeepSeek、Gemini 或其他兼容 OpenAI 格式的 API 服务。

如果你懒得分别注册一堆模型平台,也可以用统一 API token 站点。比如我自己会用:

https://nbility.dev

这类平台的好处是:一个 token 可以接入多个模型,很多开源项目只需要填 Base URL、API Key 和模型名就能跑起来。对新手来说,省事很多。


第一步:安装 Hermes Agent

登录服务器后,执行:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装完成后,重新加载 shell 环境,或者直接重新登录一次服务器。

然后检查命令是否可用:

hermes --version

如果能看到版本号,说明安装成功。

Hermes Agent 安装流程图


第二步:运行初始化配置

第一次使用建议直接跑配置向导:

hermes setup

它会让你配置模型、provider、工具等内容。

如果你用的是 OpenAI、Anthropic、OpenRouter 这类官方支持的 provider,可以按向导一路填。

如果你用的是兼容 OpenAI 格式的 API 站点,比如 Nbility,一般需要关注三个东西:

Base URL
API Key
Model Name

具体值以你自己的控制台为准。

一般来说,兼容 OpenAI 的服务会长得像这样:

Base URL: https://你的-api-地址/v1
API Key: sk-xxxxxxxxxxxxxxxx
Model: 你要使用的模型名称

注意:不要把真实 API Key 发到公开文章、截图或者群里。

Hermes Agent 调用 Nbility API 的链路图


第三步:检查环境是否正常

配置完成后,执行:

hermes doctor

这个命令会检查 Hermes 的依赖、配置、模型连接等状态。

如果你看到明显的报错,优先检查这几类问题:

  • API Key 填错
  • Base URL 少了 /v1
  • 模型名不存在
  • 服务器网络无法访问 API
  • 余额不足
  • provider 配置不匹配

如果是 token 或模型 API 的问题,可以先去你的 API 控制台看一下请求日志和余额。


第四步:启动 Hermes Agent

最简单的启动方式就是:

hermes

启动后,你会进入一个交互式命令行聊天界面。

你可以先问它一个简单问题:

你现在可以做什么?

然后试试更像 Agent 的任务:

帮我查看当前目录下有哪些文件,并解释这个项目大概是做什么的。

如果 Hermes 有终端和文件工具权限,它就可以真正去读目录、看文件,而不是凭空猜。

这一步很关键。

因为这时候你已经不是在用一个网页聊天机器人了,而是在用一个能接触系统环境的 AI Agent。

用户在终端里和 Hermes Agent 对话,Agent 正在读取项目文件


第五步:试一个真实任务

别只问“你好”这种问题。

Agent 好不好用,要看它能不能完成具体任务。

你可以试试这些:

帮我检查这个服务器的系统信息,包括 CPU、内存、磁盘和当前运行的进程。

或者:

帮我写一个 Python 脚本,每 10 分钟检查一次某个网站是否能访问,如果失败就输出错误日志。

再或者,如果你在一个项目目录里:

请阅读这个项目的 README 和 package 配置,告诉我如何启动本地开发环境。

如果它能读文件、执行命令、总结结果,说明基础能力已经通了。


为什么 AI Agent 会消耗更多 token?

很多新手第一次跑 Agent,会发现 token 消耗比普通聊天更快。

这是正常的。

因为 Agent 不是简单回答一句话。它通常会经历这个过程:

  1. 理解你的任务
  2. 查看当前环境
  3. 读取文件
  4. 分析输出
  5. 决定下一步
  6. 调用工具
  7. 再读取结果
  8. 继续推理
  9. 最后给你总结

每一步都会产生上下文。

如果它在帮你看一个代码项目,可能会读 README、配置文件、源码、测试文件、日志。读得越多,上下文越长,token 消耗就越高。

所以如果你准备长期使用 Hermes、OpenClaw、Dify、LobeChat、NextChat 这类工具,一个稳定的模型 API token 基本是刚需。

你当然可以直接用 OpenAI、Anthropic、OpenRouter 等官方或第三方平台。也可以用统一 token 站点,比如:

https://nbility.dev

我的建议是:刚开始别纠结太多,先找一个兼容 OpenAI API 的服务,把 Agent 跑起来。等你真的用起来了,再根据任务选择更便宜或更强的模型。

AI Agent token 消耗路径图


推荐的新手模型选择思路

如果你只是刚开始测试,不建议一上来就用最贵的模型。

可以按任务分:

普通聊天、总结、改简单配置:

用便宜模型

写代码、查 bug、读项目:

用中等或偏强的模型

复杂重构、长上下文分析、多步骤 Agent 任务:

用强模型

Agent 的核心不是“每次都用最贵的模型”,而是根据任务选合适的模型。

一个比较现实的组合是:

  • 日常问答:便宜模型
  • 代码任务:强一点的模型
  • 长文档分析:长上下文模型
  • 图像生成:专门的图像模型

如果你的 API 平台支持多模型切换,会方便很多。


常见问题

1. hermes 命令找不到

可能是环境变量没有刷新。

重新登录服务器,或者检查安装脚本输出里提示的 PATH 配置。

也可以试试:

which hermes

看系统能不能找到它。


2. 模型连接失败

优先检查:

hermes doctor

然后确认:

  • API Key 是否正确
  • Base URL 是否正确
  • 模型名是否正确
  • 账户是否还有余额
  • 服务器能不能访问 API 地址

很多问题其实不是 Hermes 的问题,而是 API 配置填错了。


3. Agent 为什么会执行命令?

因为这正是 Agent 和普通聊天机器人的区别。

不过也要注意安全。不要随便给陌生模型完全不受限制的服务器权限,尤其是生产服务器。

建议新手一开始在测试机、轻量服务器或容器环境里玩。


4. 可以接 Telegram、微信、QQ 吗?

可以。

Hermes Agent 支持多种消息平台。后面的文章我会继续写:

  • 如何把 Hermes 接到 Telegram
  • 如何把 Hermes 接到微信
  • 如何把 Hermes 接到 QQ 群
  • 如何做群聊自动总结
  • 如何让它帮你监控网站和服务器

部署到服务器只是第一步。真正好玩的部分在后面。


这一篇先做到这里

到这里,你已经完成了最基础的 Hermes Agent 部署:

  • 安装 Hermes
  • 完成初始化配置
  • 配好模型 API
  • 通过 hermes doctor 检查环境
  • 在终端里启动 AI Agent
  • 试着让它读取环境、执行任务

这已经比普通网页聊天前进了一大步。

下一篇我会继续写:

Hermes Agent 如何接入 Nbility:Base URL、API Key、模型名应该怎么填?

如果你也想跟着搭,可以先准备一个模型 API token。

我自己用的是:

https://nbility.dev

它适合这类开源 AI 应用的测试和部署。尤其是 Hermes、OpenClaw、Dify、LobeChat、NextChat 这种需要 OpenAI 兼容接口的项目,填好 API 地址和 token 基本就能开始跑。


可选短版摘要

如果平台需要摘要,可以用这一段:

这篇文章记录了一次从 0 部署 Hermes Agent 的过程。相比普通聊天机器人,AI Agent 可以读取文件、执行命令、调用工具并完成多步骤任务。文章介绍了服务器准备、安装命令、初始化配置、模型 API 设置、常见问题,以及为什么 Agent 类应用会持续消耗 token。适合想入门 AI Agent、Hermes Agent、OpenAI 兼容 API 和自动化助手部署的新手。

相关文章

用 Nbility 跑通你的 Agent 工作流

获取 API Key,统一接入 OpenAI 兼容模型和开发工具。

管理 API Key