跳转到主要内容
emanjusaka —— 彼岸花开可奈何

【前沿资讯】Hermes Agent v0.14.0 (2026.5.16)-基石版本更新内容

5
0
【前沿资讯】Hermes Agent v0.14.0 (2026.5.16)-基石版本更新内容

作者emanjusaka
内容源自官方日志,由 emanjusaka 整理发布。
📝 博客:彼岸花开可奈何 · emanjusaka.com · 博客园:cnblogs.com/emanjusaka · 公众号:emanjusaka的编程栈

Hermes Agent 刚刚发布了 v0.14.0 版本(v2026.5.16),官方将这个大版本定义为 “The Foundation Release”(基石版本)。

如果你之前体验过各种开源 Agent 框架,可能多多少少被臃肿的环境配置、高昂的 API 费用,或者 Agent 动不动就"跑偏"的执行力劝退过。这次 Hermes 的更新直接重构了底层,不仅大幅削减了依赖,还针对日常开发的真实痛点加了不少实用功能。

我把这次更新中所有值得关注的改动做了个梳理,分为四大块来聊聊。

一、把网页订阅变成 API,彻底省下 Token 费

这是这次更新里最实在的改动,直接关系到开发者的钱包。

  • Local Proxy(本地代理): 平时我们开发,通常既买了 Claude Pro、ChatGPT Plus 或 Grok 的网页端会员,又需要在终端里用 Aider、Cline 等代码工具。过去这意味着你要付两份钱(买会员 + 充值 API)。现在,运行 hermes proxy 可以在本地启动一个兼容 OpenAI 格式的端点。不管你登录的是哪家服务商,这个代理都能把网页端的请求伪装成标准 API 供第三方工具调用,直接白嫖你的网页订阅额度。

  • Grok 深度接入与 100万上下文: xAI 阵营这次被纳入了核心圈。有 SuperGrok 订阅就能通过 OAuth 直接免 Key 登录。更核心的是打通了 grok-4.3 的 1M (一百万) Token 上下文。遇到需要让 Agent 批量总结几十篇 ArXiv 论文,或者直接塞进整个微服务代码库排错的场景,长文本处理能力非常对口。

二、底层大换血:告别依赖地狱,原生支持 Windows

之前装 Agent 框架,经常卡在各种 npm 包或 Python 依赖冲突上。这次底层做了一次大瘦身。

  • 按需加载与性能提升: 组件改成了 Lazy-install(用到哪个才装哪个)。这让 Hermes 的冷启动时间直接缩短了约 19 秒。此外,底层重构让浏览器 CDP(Chrome DevTools Protocol)的调用速度提升了 180 倍,网页交互流畅很多。

  • Windows 原生支持 (Early Beta) 与极简安装: Windows 用户不用再硬着头皮折腾 WSL 了。官方提供了一套完整的 PowerShell 安装脚本,并且修复了以前前台 Ctrl+C 信号被吞、微软商店 Python 空壳等环境坑点。现在项目正式上了 PyPI,不管是哪个系统,只要一行命令就能跑起来: pip install hermes-agent && hermes

三、强化任务专注力,管好"跑偏"的 Agent

Agent 聊到一半卡住或者乱改代码,是很多人的噩梦。这次更新上了几道"紧箍咒"。

  • /handoff 会话热迁移: 和 Agent 聊到一半,发现当前使用的模型不够聪明,想换个大模型,或者想切换一个更懂编程的角色。以前只能新开会话重新喂背景。现在只要敲 /handoff,当前的聊天记录、上下文、甚至运行到一半的工具状态,都会直接平滑迁移给新模型,任务完全不中断。

  • Kanban 多智能体看板与 /goal 指令: 引入了持久化的任务看板机制,自带心跳检测、僵尸进程发现和无限重试。配合 /goal 目标锁定指令,能强制把 Agent 锁定在你的最终任务上(官方称之为 Ralph loop),很大程度上避免了模型在多轮调用中途跑题。

  • 文件变更验证器 (File-mutation Verifier): 针对 Agent 乱改本地代码的问题,新版加了验证机制。Agent 每次操作了磁盘文件,终端都会打印一个总结 Footer,明确标出"哪些代码真的落盘了"和"哪些只是模型以为自己改了"。排错直观了很多。

四、打破信息孤岛:更丰富的生态与交互

最后是关于连接外部环境和提升多端交互体验的细节打磨。

  • 原生工具与集成:

    • X (Twitter) 搜索: 原生第一公民级工具,支持 OAuth 或 API Key,Agent 可以直接搜推特做信息挖掘。

    • Microsoft Teams 支持: 打通了 Graph 鉴权、Webhook 监听和双向消息,方便企业内部署。

    • Claude Prompt Caching: 实现了跨会话的 1 小时提示词缓存,降低 API 延迟和成本。

    • Zed 编辑器支持: 加入了对 Zed 编辑器 ACP 注册表的集成。

  • 交互体验升级:

    • IM 原生按钮: 在 Telegram 或 Discord 里,当 Agent 需要你做选择(调用 clarify 工具)时,会直接渲染出原生可点击的按钮。你不需要再手动回复数字"1"或"2"了,点一下就行。

    • 统一视频生成: video_generate 后端做了统一和解耦,方便后期无缝切换不同的视频生成模型。

  • 插件与技能系统扩展:

    • 开发者在自己写插件时,可以直接用 ctx.llm 随时随地唤起大模型,并且支持用 tool_override 轻松覆盖内置工具。

    • 技能中心(Skills Hub)大扩容:官方将 HuggingFace 设为默认受信任源,社区新增了 9 个重量级技能,涵盖 Web3 多链开发(Unified EVM)、Hyperliquid 交易接口、雅虎财经数据以及专业的 OSINT(开源情报)调查工具。

总体来看,v0.14.0 没有搞太多花哨的噱头,而是把精力集中在了降低使用门槛、优化执行稳定性和扩展真实业务场景上。对于想把 Agent 从"测试脚本"变成"日常干活工具"的开发者来说,这个基石版本解决了不少基础设施级别的痛点,值得升级体验一下。

···

版权声明 COPYRIGHT

谦学于心,谷纳万物,静思致远,共筑收获之旅!