102 lines
10 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# TODO
- 更新时间2026-04-07
- 进度基线2026-04-02 已完成一次 MVP 收敛;`npm run test``npm run typecheck` 通过Web/API 实机流程已验证JD 实时会话导入与 `search/detail/reviews` preview 已实机验证。2026-04-03 已补齐 JD detail/reviews 可换 SKU 模板回放、评论多页聚合去重与 `live-product-preview` API同日已把 JD live session 导入页、实时 search、实时 detail/reviews 抓取、规则化分析与报告发布并入任务主链,最小闭环 `输入商品 -> 选择 -> 抓取 -> 分析 -> 结果展示` 已可通过 Web/API 跑通;同日也已通过 MCP 浏览器实时登录态验证天猫 `live-product-preview`,真实商品 `934454505228` 可抓到详情与评论。最新一轮已把京东登录态维护从普通用户页切到 `/ops/jd/session-manager` 运维页,并补齐后端 Session Manager 健康检查、自动恢复、手工注入与前后端回归测试;本轮继续将天猫也切入运维侧 Session Manager新增 `/api/ops/tmall/session-manager` 与统一 `/ops/session-manager` 运维页,普通用户页不再暴露天猫登录和模板入口。随后已补齐天猫实时 `search` HTML 解析、`/api/platforms/tmall/live-search-preview` 与任务搜索主链接入,并新增 JD + 天猫双平台 live 主回归用例。最新补充了天猫 `Blocked -> retry success` 报告升版回归,以及 `SearchBlocked` 恢复后二次确认只补跑新恢复平台、不重复执行已完成平台的主链修复与回归。2026-04-07 已把确认后的主执行链切到开发环境后台异步执行,`/api/tasks/:taskId/events` 从一次性 snapshot 升级为持续 SSE执行页已接入 `EventSource` 实时接收任务快照;本地热重载环境可直接边看页面边验证后端推进。同日已在统一 `/ops/session-manager` 运维页接入京东/天猫扫码登录,后端受控浏览器会实时截图真实登录二维码并在扫码成功后自动导入 Cookie 与模板到 Session Manager目前已实机验证两平台都能进入 `waiting_for_scan`,完整人工扫码闭环仍待真实账号验收。仓库级 `npm run test``npm run typecheck` 已再次通过
- 关联文档:
- `docs/tasks.md`
- `docs/DevelopmentPlan.md`
- `docs/tdd.md`
## 维护约定
- 已完成任务统一使用 `- [x]`
- 未完成任务统一使用 `- [ ]`
- 进行中任务使用 `- [ ] ...(进行中)`
- 阻塞任务使用 `- [ ] ...(阻塞:原因)`
- 任务编号必须与 `docs/tasks.md` 对齐;若任务拆分、合并或改号,两个文件必须同步更新
## 当前主线
- [x] `S1-06` 会话中心 v1 与全局会话准备后端入口落地MVP mock 版,支持 24h 会话、清理与回跳)
- [x] `S1-07` 新建任务页与全局会话准备入口落地
- [x] `S2-01` 首个平台预检查与搜索适配器落地MVP mock 版)
- [x] `S2-05` 标准化 v1 与最小报告快照落地(规则版)
- [ ] `S2-06` 单平台执行页闭环与回归包落地(进行中:新建 -> 确认 -> 异步执行 -> 报告已打通,执行页 SSE 实时更新已接入,回归包仍待继续补齐)
- [ ] `S3-01` 第二平台 `precheck/search/detail/reviews` 适配器落地(进行中:天猫商品详情已改为登录态 HTML/SSR 内嵌状态解析,评论已确认 `mtop.taobao.rate.detaillist.get` 并在 `apps/api` 补齐 `_m_h5_tk` 重签名回放;已通过 MCP 浏览器实时登录态实机验证真实商品 `934454505228``live-product-preview` 可返回详情与评论;本轮已补齐天猫运维侧 Session Manager、健康检查、统一运维页、实时 `search` HTML 解析、`live-search-preview` API 与任务搜索主链接入;当前待补真实 fixture/HAR
- [ ] `S3-03` 阻塞恢复与 `L3 Browser Recovery` 落地(进行中:恢复页与重试链路已通,真实远程浏览器接管待补)
- [ ] `S4-02` AI 结构化报告生成与版本规则落地(进行中:版本规则已落地,真实 AI 生成待接入)
- [ ] `S4-05` 留存、删除 API 与联动清理链路落地(进行中:删除 API 与 30/90 天本地清理作业已落地,对象存储联动待补)
- [ ] `S4-06` 完整可观测性与审计日志落地进行中overview / audit 已有,完整指标体系待补)
## 阶段快照
- [ ] `S0` 双平台能力矩阵、fixture/HAR、PoC 验证与 `strategy_attempts` 口径仍未冻结(进行中)
- [ ] `S1` 本地 JSON 持久化、API/BFF、会话准备、新建任务页与状态机骨架已可用但数据库、队列、真实 `SSE` 仍未完成(进行中)
- [ ] `S2` 单平台最小闭环和最小报告已可演示JD `search/detail/reviews` 已并入任务执行与报告主链,评论预算分配与 `40/30/30` 抽样已落地,开发环境后台异步执行与执行页实时更新已打通,但模板刷新与真实 AI 归纳仍待补(进行中)
- [ ] `S3` 双平台候选确认、执行控制台、恢复页与平台级重试已可用,第二平台 `search/detail/reviews` 任务主链也已接通,但真实 fixture/HAR、`L2` 模板刷新与真实 `L3` 恢复未完成(进行中)
- [ ] `S4` 报告版本规则、报告页、历史任务页、版本切换、删除入口与观测概览已落地,但完整聚合、真实 AI、对象存储联动与完整审计仍未完成进行中
- [ ] `S5` 稳定性、性能、UAT、部署与发布准备尚未进入实施未开始
## `S0`
- [ ] `S0-01` 冻结双平台能力矩阵(未开始)
- [ ] `S0-02` 产出双平台首批 fixture 与 HAR 样本(未开始)
- [ ] `S0-03` 验证服务端受控浏览器与会话快照 PoC进行中
- [ ] `S0-04` 验证至少一个平台的非浏览器主路径 PoC进行中JD 已完成授权会话下 `search/detail/reviews` 实时 API 预览验证,待补模板刷新与量化口径)
- [x] `S0-05` 搭建 Monorepo 与基础工程骨架
- [ ] `S0-06` 冻结 Phase 0 量化评分表、`strategy_attempts` 记录格式与进入开发门槛(未开始)
## `S1`
- [x] `S1-01` 共享领域模型与枚举包落地
- [ ] `S1-02` 数据库、事件日志与对象存储模型落地进行中MVP 先落本地 JSON 持久化,正式数据库与对象存储待补)
- [ ] `S1-03` 任务编排、事件持久化与状态机骨架落地(进行中:状态机、事件日志、平台级重试已可用,队列化执行待补)
- [ ] `S1-04` API / BFF、平台就绪摘要与 `SSE` 基础接口落地进行中REST/BFF 已可用,任务级 `SSE` 已升级为持续推送,完整实时编排仍待补)
- [x] `S1-05` Web 工作台基础壳层与核心路由落地
- [x] `S1-06` 会话中心 v1 与全局会话准备后端入口落地MVP mock 版)
- [x] `S1-07` 新建任务页与全局会话准备入口落地
- [ ] `S1-08` TDD 与 CI 基础链路落地(进行中)
## `S2`
- [x] `S2-01` 首个平台预检查与搜索适配器落地MVP mock 版)
- [x] `S2-02` 候选确认页与确认 API 落地
- [ ] `S2-03` 单平台商品详情抓取链路落地进行中JD live detail 已并入任务执行主链,确认页选中的真实 SKU 会进入 `previewProduct` 抓取与报告证据生成;模板失效、风控拦截与会话失效已做结构化归类,`L2` 刷新待补)
- [ ] `S2-04` 单平台评论采集与抽样链路落地进行中JD live reviews 已并入任务执行与报告主链,支持分页参数改写、多页聚合去重、重复页提前收口、候选级评论预算分配与 `40/30/30` 抽样;模板刷新待补)
- [x] `S2-05` 标准化 v1 与最小报告快照落地(规则版)
- [ ] `S2-06` 单平台执行页闭环与回归包落地(进行中:新建 -> 确认 -> 异步执行 -> 报告已打通,执行页 SSE 实时更新已接入)
## `S3`
- [ ] `S3-01` 第二平台 `precheck/search/detail/reviews` 适配器落地(进行中:天猫详情已切到登录态 HTML/SSR 内嵌状态解析,评论走带 `_m_h5_tk` 重签名的 `rate.detaillist` 回放;`live-session``live-search/detail/reviews/product preview` 与任务执行主链回放已通过测试,待补真实 fixture/HAR
- [ ] `S3-02` 模板刷新与 `L2` 路径落地(未开始)
- [ ] `S3-03` 阻塞恢复与 `L3 Browser Recovery` 落地(进行中)
- [ ] `S3-04` 双平台候选确认与执行控制台落地(进行中:页面与状态展示已具备,真实并发执行待补)
- [x] `S3-05` `PartialCompleted``Blocked``Failed` 汇总规则落地
- [ ] `S3-06` 双平台主回归包落地(进行中:已新增 JD + 天猫 live 搜索、确认、执行、报告的主链 API 回归,并覆盖 `tmall SearchBlocked + jd Completed``tmall NoResult + jd Completed``tmall Blocked + jd Completed``tmall Blocked -> retry success -> report v2``tmall Blocked -> retry blocked -> report unchanged``tmall SearchBlocked -> retry success -> audit/metrics`,以及 `tmall SearchBlocked` 恢复后二次确认仅补跑新恢复平台的回归,待继续补更多失败/恢复组合)
## `S4`
- [ ] `S4-01` 完整标准化与三级聚合落地(进行中)
- [ ] `S4-02` AI 结构化报告生成与版本规则落地(进行中)
- [ ] `S4-03` 报告页、证据抽屉与质量标记落地(进行中:报告页、质量标记与证据索引已落地,证据抽屉待补)
- [x] `S4-04` 历史任务页、版本切换与删除入口落地
- [ ] `S4-05` 留存、删除 API 与联动清理链路落地(进行中:删除 API 与 30/90 天本地清理作业已落地,对象存储联动待补)
- [ ] `S4-06` 完整可观测性与审计日志落地(进行中)
## `S5`
- [ ] `S5-01` 平台级定向重试稳定化(进行中:已补天猫 `SearchBlocked` 恢复后的审计与 `retryCount/recoveryCount` 回归,待继续扩展更多失败来源与版本差异检测)
- [ ] `S5-02` 性能与成本优化(未开始)
- [ ] `S5-03` UAT 与试运行任务集执行(未开始)
- [ ] `S5-04` 部署、值守、排障与热修手册落地(未开始)
- [ ] `S5-05` 最终验收与文档同步收口(未开始)
## 横向任务
- [ ] `X-01` 上下游文档变更同步(进行中)
- [ ] `X-02` 安全与合规检查(未开始)
- [ ] `X-03` 测试资产维护(进行中:已补天猫搜索解析/服务回归,以及双平台 live 主链、`SearchBlocked``NoResult``Blocked``Blocked -> retry success``Blocked -> retry blocked -> report unchanged``SearchBlocked -> retry success -> audit/metrics``SearchBlocked` 恢复后二次确认不重复执行已完成平台的回归,真实 fixture/HAR 待补)
- [ ] `X-04` 设计一致性与可访问性检查(进行中)
- [ ] `X-05` 观测指标复盘(未开始)