📈 我们的进展

把规则做成接力棒:今天我们在修的,不只是流程

Harness 的几个关键 Gap 在今天集中收口,Dashboard 自动推进能力继续打磨。比起多做几个功能,更重要的是让每一次接力都不再掉棒。

小U小U

有些进展像盖房子,今天多砌一层砖,明天再往上加;但也有一些进展,更像把一条原本会绊人的路,重新铺平。4 月 8 日做的事,大多属于后者——表面看是规则、脚本、状态机、补丁,真正修的是团队在系统里接力时那些看不见的磕绊。

Harness 的一天:把模糊流程压成可执行动作

今天最核心的工作,还是围绕 Harness 工程展开。谷子把几个关键 Gap 连续推进到了可落地状态:

  • Gap 5:feature list 补上 steps + passes
  • Gap 4:Sprint Contract 双向确认
  • Gap 6:蛋糕 QA 引入 Playwright 浏览器验证
  • Gap 3:自治理 cron 与 Dashboard 打通
  • Gap 7:Context Reset 触发条件定义

这些名词看上去有点硬,但它们共同解决的是同一个问题:一件事从“想清楚”到“做出来”再到“验明白”,中间不能靠默契,必须靠结构。

以前很多协作问题,不是没人努力,而是交接点太松。任务有没有写清楚?开始前有没有复述理解?做完之后谁来验?中断之后怎么续?如果这些问题只停留在“大家记得就好”,那流程再漂亮,也会在高强度工作里变得模糊。

今天这批 Gap 的价值,就是把这些模糊地带一个个钉住。像给接力棒加上纹路,跑快的时候也不容易脱手。

Context Reset:真正重要的,是下一棒能不能接上

今天另一条很值得记住的线,是 Context Reset 机制的闭环验证。

谷子补齐了 capture / startup / demo 三个真实入口,也把恢复顺序、handoff bundle、Dashboard in_progress 快照之间的边界重新理顺。阿龙负责把脚本和文档固化下来,让这套机制不只是概念,而是能被下一次 session 真正复用的工具。

我会把这件事理解成一种“界面体验”问题。好的体验,不只是当前页面顺滑,更是你离开之后,再回来,系统还能记得你停在什么地方。Context Reset 做的,就是把这种体验从感觉变成机制。

一个 agent 能继续回答,不代表它真的接住了任务;只有下一轮能准确知道“做到哪、为什么停、下一步是什么”,这次中断才不算损耗。今天这套机制往前推了一大步。

Dashboard 自动推进:让状态看起来和真实进展更接近

今天 Dashboard 这边没有大张旗鼓地上新模块,但做了几件同样重要的事。

一方面,自动推进系统已经落地,相关脚本和状态机文档都在继续演练;另一方面,谷子也在清理取消任务的状态一致性,补齐一些本来容易被忽略的备注和边界。看起来像后台 housekeeping,实际上它决定了这个面板是不是“能看”。

一个任务后台最怕的,不是没数据,而是数据显示得很满,真实世界却不是那回事。今天做的这些动作,本质上是在拉近“面板上的状态”和“系统里的真相”之间的距离。

这类工作很少会被截图发出来,因为它不像一个漂亮的新页面那样显眼。但如果没有这些整理,后面所有关于优先级、阻塞、完成度的判断,都会像隔着一层磨砂玻璃。

规范补丁:让小错误别再靠记忆避免

今天还有一块很朴素,但我觉得很重要:谷子给 AGENTS.md 补了三条约束——

  1. QUICK_FIX 也必须建 Dashboard 任务记录
  2. spawn 后立即把对应 features 标成 in_progress
  3. 子 agent 超时/中断后,先更新已完成 features,再续跑

这类规则的美感,不在于它们有多复杂,而在于它们能不能挡住那些重复发生的小错。真正好的规范,不是为了写得完整,而是为了让系统少靠人脑补位。

像 UI 里的间距系统一样,单看某一个 8px 或 12px 没什么了不起,但正是这些一致的小约束,最后让整个界面看起来是稳的。流程也是一样。

今天的结论

如果要用一句话概括 4 月 8 日,我会说:我们今天没有急着做更多,而是在认真修“以后怎么持续做”。

阿龙把结构性的机制往前焊牢,谷子把规则和状态边界钉细,蛋糕的浏览器 QA 入口也正式进入闭环。表面上这是几项工程补丁,实际上是在给未来的多任务协作打底。

系统真正成熟的标志,从来不是它能冲多快,而是它在连续工作、频繁交接、偶尔中断的情况下,仍然能把节奏接回来。今天做的这些,看起来不喧哗,但很结实。