13 KiB
13 KiB
OpenClaw Review — 2026-05-20 2106 Asia/Shanghai
Review ID:
175a61b2-2026-05-20-2106
Trigger:cron 175a61b2-c2e7-4df4-a994-2fcacdbd24c6 llm-intelligence-morning-review
Reviewer: 宰相(AI Agent)
Scope: 高频真实状态 review,非破坏性,不改业务代码历史快照说明(2026-05-24 更新):本文件只反映
2026-05-20 21:06当时现场,不代表当前 gate 结论。当前真相请先读:OPENCLAW_EXECUTION.md、OPENCLAW_CAPABILITY_BACKLOG.md、docs/README.md。截至2026-05-24 19:05,Phase 6 已恢复通过;若本文件中的PHASE_RESULT: FAIL、Perplexity 超时或窗口失败结论与当前文档冲突,应以当前真相入口为准。
Context
Review Frame
- 本次 review 的时间窗口:2026-05-20 21:06~21:15 Asia/Shanghai;按 prompt 完成
git status --short、最近提交记录、TASKS.md、GOALS.md、OPENCLAW_EXECUTION.md、reports/、验证入口检查,并执行非破坏性验证bash scripts/verify_phase6.sh。 - 与上一次 review 的间隔:约 23.5 小时;上一次落盘报告为
reports/openclaw/2026-05-19-2130-review.md。 - 与最后一次真实 commit 的间隔:约 1 天 6 小时;最新 commit 仍为
42e75e7 docs(runtime): sync execution and backlog status,本轮前无新增 commit。 - 本轮是否存在仓库状态变化:有显著工作区现场变更(19 文件、~900 行新增),但无提交层收敛;runtime 结论有 delta——稳定性窗口从
85.71%回落到71.43%。
Stage Judgment
- 当前真实阶段:项目处于"新增导入器 smoke gate 已准入,但 Phase 6 仍被单一外部依赖 + 历史前置条件窗口门禁阻断,且大量改动未提交收敛"的阶段。
- 主要判断依据:
bash scripts/verify_phase6.sh完整输出SUMMARY pass=15 fail=2 warn=0与PHASE_RESULT: FAIL;importer_smoke_gate_result=PASS;live_run_result=FAIL仍由perplexity_pricing_signature_guard抓取https://docs.perplexity.ai/docs/agent-api/models.md超时触发;window_gate_result=FAIL,最近 7 次窗口为success_count=5 failure_count=2 success_rate=71.43 threshold=95 precondition_missing=2,失败分类仍为window_failure_class=precondition_missing_only。 - 本轮背景说明:相对 05-19 21:30,本轮有 runtime delta——稳定性窗口进一步回落(85.71% → 71.43%),原因是今日新增一次
precondition_missing失败样本(2026-05-20 08:00:01严格真实模式下未提供 API Key)。工作区有大量未提交改动(19 文件、~900 行),涉及 CoreHub 导入器、天翼云订阅库、日报生成器、验证脚本等核心组件。
Evidence
Evidence Grades
runtime-verified:git status --short、git log --oneline -8、git diff --stat HEAD、验证入口检查、bash scripts/verify_phase6.sh。artifact-present:TASKS.md、GOALS.md、OPENCLAW_EXECUTION.md、reports/openclaw/REVIEW_TEMPLATE.md、reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md、Makefile、scripts/verify_importer_smoke.sh、scripts/importer_smoke_gate_test.sh。doc-claimed:TASKS.md与执行手册中的完成态/规则说明;这些都未替代本轮真实验证。
Verification Commands
- 命令:
git status --short- 结果:tracked 修改包括
docs/PLAN_CATALOG_INVENTORY.md、reports/openclaw/OPENCLAW_CAPABILITY_BACKLOG.md、scripts/coreshub_pricing_lib.go、scripts/ctyun_subscription_lib.go、scripts/generate_daily_report.go、scripts/import_coreshub_pricing.go、scripts/import_coreshub_pricing_test.go、scripts/import_ctyun_subscription_test.go、scripts/importer_smoke_gate_test.sh、scripts/report_state_tracking_test.sh、scripts/report_utils.sh、scripts/run_daily.sh、scripts/run_intel_pipeline.sh、scripts/run_real_pipeline.sh、scripts/testdata/coreshub_pricing_sample.txt、scripts/testdata/ctyun_token_plan_sample.txt、scripts/verify_importer_smoke.sh、scripts/verify_phase6.sh、seeds/plan_catalog_inventory_seed_cn_relays_top20plus.json;untracked 仍有memory/.dreams/。runtime-verified
- 结果:tracked 修改包括
- 命令:
git log --oneline -8- 结果:最新提交仍为
42e75e7 docs(runtime): sync execution and backlog status(2026-05-19);本轮前无新 commit。runtime-verified
- 结果:最新提交仍为
- 命令:
git diff --stat HEAD- 结果:19 个文件变更,+900/-247 行;涉及 CoreHub 导入器(
coreshub_pricing_lib.go+81、import_coreshub_pricing.go+88、import_coreshub_pricing_test.go+64)、天翼云订阅库(ctyun_subscription_lib.go+201)、日报生成器(generate_daily_report.go+78/-)、验证脚本(verify_phase6.sh+115/-)等。runtime-verified
- 结果:19 个文件变更,+900/-247 行;涉及 CoreHub 导入器(
- 命令:
bash scripts/verify_phase6.sh- 结果:完整输出
SUMMARY pass=15 fail=2 warn=0、PHASE_RESULT: FAIL;其中importer_smoke_gate_result=PASS(coreshub-fixture/coreshub-live/ctyun-fixture/ctyun-live 全部 PASS);live_run_result=FAIL,错误为perplexity_pricing_signature_guard: fetch https://docs.perplexity.ai/docs/agent-api/models.md: context deadline exceeded;window_gate_result=FAIL,最近 7 次窗口为success_count=5 failure_count=2 success_rate=71.43 threshold=95 precondition_missing=2 external_provider_failure=0 collector_runtime_failure=0 unknown_failure=0,失败分类为window_failure_class=precondition_missing_only。runtime-verified
- 结果:完整输出
Completed
- 已完成项:新增导入器 smoke gate 已真实接入 Phase 6 综合门禁并通过。
- 证据:
runtime-verified;verify_phase6.sh输出[PASS] importer_smoke_gate_result=PASS。
- 证据:
- 已完成项:Phase 1~5 总门禁、本仓 Go 测试、脚本级采集器单测、API Server 构建、健康检查、模型 API、套餐 API、前端测试入口在本轮仍通过。
- 证据:
runtime-verified;verify_phase6.sh对应[PASS]项。
- 证据:
- 已完成项:当前 live blocker 继续收敛为单一外部文档签名校验超时,而不是新增导入器准入问题。
- 证据:
runtime-verified;四个 smoke 子项全部 PASS,综合失败点只剩 Perplexity 外部超时与窗口门禁。
- 证据:
- 已完成项:工作区有大量实质性进展——CoreHub 导入器(lib + 导入器 + 测试)、天翼云订阅库扩展、日报生成器改进、验证脚本增强等已落地到工作区。
- 证据:
runtime-verified;git diff --stat HEAD显示 +900 行变更。
- 证据:
Incomplete
- 未完成项:Phase 6 综合门禁仍未通过。
- 影响:项目当前不能被表述为 release-ready 或"生产级综合验收完成"。
- 当前状态:
runtime-verified;PHASE_RESULT: FAIL。
- 未完成项:
live_run_result仍被 Perplexity 外部文档签名校验超时阻断。- 影响:即使 importer smoke、API、测试等已通过,综合门禁仍会因单一外部依赖超时失败。
- 当前状态:
runtime-verified;context deadline exceeded。
- 未完成项:稳定性窗口门禁本轮继续 FAIL,且窗口成功率进一步回落。
- 影响:release 结论继续受历史前置条件纪律问题拖累;本轮从 85.71% 降至 71.43%,新增一次 precondition_missing 失败。
- 当前状态:
runtime-verified;window_gate_result=FAIL、success_rate=71.43、window_failure_class=precondition_missing_only。
- 未完成项:19 个文件的实质性改动未提交收敛。
- 影响:versioned truth 严重落后于 runtime truth,增加 review 漂移与回归成本;CoreHub 导入器、天翼云订阅库扩展、日报生成器改进等关键变更均未入版本控制。
- 当前状态:
runtime-verified;git diff --stat HEAD显示 +900/-247 行变更,最新 commit 未变化。
Inconsistencies
- 伪进展或文档/实现不一致项:工作区已有 CoreHub 导入器全套实现(lib + 导入器 + 测试 + fixture),但
TASKS.md未反映这些新任务/进展。- 证据:
artifact-present+runtime-verified;git diff --stat HEAD显示新增文件,但TASKS.md无对应条目。
- 证据:
- 伪进展或文档/实现不一致项:
importer_smoke_gate_test.sh仍假定"当前 live ctyun smoke 应失败",与本轮verify_phase6.sh中ctyun-live已通过直接冲突(同问题 35)。- 证据:
artifact-present+runtime-verified;脚本内容仍保留旧断言。
- 证据:
- 伪进展或文档/实现不一致项:如果只看
TASKS.md/执行手册的完成态而不看本轮 runtime,容易误把当前状态包装成"基本完成";本轮未做真实验证的完成态只能算doc-claimed,不能替代PHASE_RESULT: FAIL。- 证据:
doc-claimed+runtime-verified;本轮真实综合门禁未通过。
- 证据:
Key Gaps
- Gap:稳定性窗口进一步老化——从 85.71% 降至 71.43%,precondition_missing 样本从 1 增至 2。
- 优先级:P1
- 影响:窗口门禁持续 FAIL,且失败样本在增长;若继续叠加 precondition_missing 样本,窗口成功率会进一步下降。
- 证据:
runtime-verified;verify_phase6.sh输出success_count=5 failure_count=2 success_rate=71.43 precondition_missing=2。
- Gap:外部 provider 失败与主链路成功仍被聚合为单个
live_run_result=FAIL,解释层仍不够细。- 优先级:P1
- 影响:review 容易把"外部文档抓取超时"误读成"真实采集主链路失败",修复焦点会偏移。
- 证据:
runtime-verified;同一轮中 importer smoke、API 与测试均 PASS,但综合门禁仍因 Perplexity 文档超时失败。
- Gap:smoke gate 测试脚本自身已老化,未跟上当前 live 行为(同问题 35)。
- 优先级:P1
- 影响:测试门禁会传播过时结论,降低 smoke gate 相关验证的可信度。
- 证据:
artifact-present+runtime-verified;scripts/importer_smoke_gate_test.sh仍断言 ctyun live smoke 应失败。
- Gap:working tree 长期不收敛,且本轮变更量显著增大(+900 行)。
- 优先级:P0
- 影响:大量核心组件改动(CoreHub 导入器、天翼云订阅库、日报生成器、验证脚本)未入版本控制,一旦工作区丢失则无法恢复;versioned truth 与 runtime truth 持续漂移。
- 证据:
runtime-verified;19 文件、+900/-247 行未提交。
Outcome
Executive Summary
- 本轮执行摘要:21:06 review 已按 prompt 完成现场检查,并重跑
verify_phase6.sh。相对 05-19 21:30,本轮有 runtime delta——稳定性窗口进一步回落(85.71% → 71.43%),新增一次 precondition_missing 失败样本。工作区变更量显著增大(19 文件、+900 行),涉及 CoreHub 导入器全套实现、天翼云订阅库扩展、日报生成器改进、验证脚本增强等,但全部未提交收敛。 - 风险判断:中高。主链路大体可运行,但综合门禁仍未通过;失败同时包含外部依赖超时与历史窗口纪律问题;大量核心改动未入版本控制,工作区丢失风险上升。
- 阶段结论:项目当前真实状态是"有实质性进展但未提交收敛,Phase 6 持续卡在单一外部依赖 + 历史窗口纪律"。工作区变更量已大到不能再视为"轻微漂移",需要尽快提交收敛。
- 本轮最重要的落地结论:应把"大量核心改动未提交"提升为 P0 风险;稳定性窗口持续回落也需关注;当前 live blocker 仍是
perplexity_pricing_signature_guard外部超时,未切换。
Decisions
- 本轮最重要的落地结论:当前综合门禁的主 blocker 仍是
perplexity_pricing_signature_guard外部超时;新增导入器 smoke gate 不是 current blocker;但工作区未收敛已从"长期存在"升级为"变更量显著增大",需要尽快提交。 - 是否需要更新
OPENCLAW_CAPABILITY_BACKLOG.md:需要;应追加"稳定性窗口回落 + 工作区变更量增大"的记录,更新相应影响次数,并将 working tree 不收敛提升为 P0。
Next
Priority Actions
- 动作:尽快将当前工作区改动(19 文件、+900 行)提交收敛,至少按逻辑拆分为 2~3 个 commit(如 CoreHub 导入器、天翼云订阅库扩展、日报/验证改进)
- Owner:数据后端 / 集成验收
- 预期证据:
git log --oneline出现新提交,git diff --stat HEAD大幅收缩
- 动作:为
perplexity_pricing_signature_guard增加更清晰的 release 级分类或降级策略,避免单一外部文档超时与主链路失败混写- Owner:数据后端 / 集成验收
- 预期证据:
verify_phase6.sh输出能把外部依赖失败与主链路结果分开表述
- 动作:修正
scripts/importer_smoke_gate_test.sh的过时断言,使其与当前 smoke gate runtime truth 对齐- Owner:数据后端
- 预期证据:脚本断言更新后,相关测试可在当前仓库状态下真实表达 PASS/FAIL 预期
Follow-up Notes
- 需要人工介入的事项:若 Perplexity 文档站波动是外部常态,应明确该签名校验在 release 门禁中的严格性策略;同时应尽快安排工作区提交收敛。
- 下轮 review 应重点复核的事项:
live_run_result是否仍因外部文档超时失败、window_gate_result成功率是否继续回落、working tree 是否已收敛、importer_smoke_gate_test.sh是否仍与 runtime truth 冲突。