电话: 邮箱:

开云体育(中国)官方网站 澳洲放羊大叔引爆 AI 编程翻新!Claude Code 急推 goal 形状,不干完不许停

发布日期:2026-05-14 02:21 作者:admin 来源:未知 点击:117

开云体育(中国)官方网站 澳洲放羊大叔引爆 AI 编程翻新!Claude Code 急推 goal 形状,不干完不许停

澳洲牧羊大叔顺手写的三行 bash,11 天内被 OpenAI、Anthropic 和 Hermes 集体收编了。

一醒觉来,Claude Code 又更新!

为了让 Claude 握续责任直到任务完成,Claude Code 最近推出的新功能:/goal 。

你惟一设定条款,Claude 不完成任务它毫不领域!

伸开剩余90%

用过 AI 编程用具的东说念主皆懂,这到底多蹙迫!

你给 Agent 下了一个任务,它跑了三个回合,改了两个文献,转眼停驻来问你「接下来需要我作念什么?」

不是,bug 你这还没修完呢啊!

Agent 越来越智谋,写代码越来越快,但「重新到尾把一件事干完」这件事,到 2026 岁首皆莫得一家能作念到。

然后,一位来自澳大利亚的牧羊大叔 Geoffrey Huntley,用三行 bash 不断了。

while :; do cat PROMPT.md | claude-code --continuedone

他把它定名为 Ralph Loop,致意《辛普森一家》里阿谁始终搞不清景色但从不清除的小孩 Ralph Wiggum。

逻辑极其狰狞,无穷轮回,反复把团结个 prompt 喂给 Agent。程度写在文献系统和 Git 历史里,高下文满了就开新实例,读文献接着干。

原始,不优雅,但至极灵验。

灵验到 OpenAI 看见了,Nous Research 看见了,Anthropic 也看见了。

11 天,三家顶级 AI 实验室,异曲同工地把这三行 bash 写进了官方家具。

这一刻,所有东说念主皆昭彰了一件事 ——

通用东说念主工智能的临门一脚,可能不是更智谋的模子,而是「把事作念完」的模子。

换句话说,AI 编程的中枢战场正在从「生成代码」转向「闭环委用」。

11 天,三条线,团结个绝顶

4 月 30 日,OpenAI 的 Codex 领先上线 / goal。

Greg Brockman 在 X 上只丢了一句,「Codex 现已内置 Ralph loop++」。

一周后,Hermes Agent 跟上。又过 4 天,Claude Code 也上了。

11 天。三家。团结个敕令。团结个功能。

但完结旅途,差了十万八沉。

Codex「不忘事」,Hermes「不烂尾」,Claude Code「不自欺」。

Codex:把蓄意存成一条数据库记载

OpenAI 是三家里启程点开头的,有蓄意也最纯粹。

在 Codex 里,/goal 是一个握久化的责任流对象,存在腹地的 app-server 状态层里。

关掉末端、合上札记本、致使重启系统,蓄意皆不会丢。下次大开 Codex,自动接上。

模子通过结构化的 update_goal 用具陈说程度状态,token 预算破钞时触发「软着陆」而非硬停。

有东说念主用这个功能流畅跑了 14 个小时,中间暂停 5 小时去睡眠,归来 Codex 从断点续跑,把一个成立驱动样式作念罢了。

工程化,干净,但克制。

Hermes Agent:一个东说念骨干不完,开云体育(中国)2026世界杯官方IOS|Android手机app下载那就上一个团队

Hermes Agent 的计较最大。

在这里,/goal 仅仅冰山一角。着实的重头戏是多智能体看板系统,Hermes 把「让 AI 把活干完」从单 Agent 问题升级成了团队衔尾问题。

看板的底层是腹地 SQLite,握久化存储,跨重启不丢。

你在上头创建一个任务卡片,Hermes 会平直把它拆成多个子任务,分拨给不同的 Agent worker。每个 worker 是一个独处的 OS 过程,有我方的身份、模子竖立和责任目次。

看板和 / goal 是两套互补的系统。/goal 管的是单个 Agent 的蓄意锁定(Ralph loop),看板管的是多个 Agent 之间的任务休养。一个纵向深切,一个横向铺开。

临了,是五层防烂尾机制。

第一层,心跳检测。每个 worker 按期向看板报到,讲明我方还辞世。

第二层,僵尸回收。worker 超时没反应?系统自动判定牺牲,回收它手上的任务从新分拨。macOS 上还有挑升的达尔文僵尸检测逻辑。

第三层,退出遏止。worker 没完成任务就退出了?系统自动把它标志为 blocked,不让它再接新活,防御「摸鱼型 Agent」反复领任务又不作念。

第四层,幻觉遏止。这是最狠的一层。AI 说「我作念罢了」不算数,系统会考证它施行产出的代码是否竟然落盘了。Agent 说我方创建了一个文献但施行上莫得?收拢,回滚,重来。

第五层,重试预算。每个任务有独处的 max_retries,最多重试 N 次,跨越就上报东说念主类。完好意思不会无穷轮回到死机。

Claude Code:作念事的东说念主和验收的东说念主,弗成是团结个

Anthropic 是三家里临了开头的,但有蓄意最微妙。

本色上,Claude Code 的 / goal 是一个 session 级别的 Stop Hook。

你设定一个完成条款(比如「test / auth 目次下所有测试通过且 lint 无报错」),Claude 就运行干活。

关键假想在验收设施。每干完一轮,系统不让 Claude 我方判断「我作念罢了莫得」。

它把对话记载和你的完成条款整个发给一个独处的小模子(默许是 Haiku),让这个小模子来裁判。

小模子淌若以为没完成,就需要复返一个具体根由(比如「test_login.py还有 2 个 failure」)。然后这个根由会被注入 Claude 下一轮的高下文,指引它接着干。

淌若小模子认为完成了,蓄意就会自动废除,任务结尾。

值得一提的是,这个裁判模子不调用任何用具,不读文献,不跑敕令。它只看 Claude 在对话里产出的内容。

是以,你的完成条款必须是 Claude 在对话中能讲明的东西。

它最长复古 4000 字符,因此你不错写得很细。

致使,还不错在条款里加阻挡,比如「不修改其他测试文献」「20 轮内完成不然罢手」等等。

决赛进行时:责任流进口

把视角拉远一步。

Claude Code 背后站着 Anthropic,Codex 背后站着 OpenAI,Hermes Agent 接入了双方的模子,同期亦然 DeepSeek V4 等模子的主力分发渠说念。

三条旅途,碰巧秘密了 ASI 决赛的三个生态进口。

而他们争的,亦然团结样东西 —— 责任流。

谁的 Agent 先闪开垦者养成「设完蓄意就走开」的民风,谁就锁死了责任流进口。

因为民风一朝造成,搬动资本是指数级的。

你不会蹂躏离开一个照旧跑通了看板休养、断点续传、checkpoint 回滚的 Agent 基础设施。

一个看似很小的 / goal 敕令,背后卡的是整条 Agent 责任流的护城河。

参考尊府:

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

ag真人app官方网站入口

https://developers.openai.com/codex/changelog开云体育(中国)官方网站

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

https://developers.openai.com/codex/changelog

发布于:山东省
相关标签: