综合审核并完善需求文档

- 增加版本历史追踪文档变更 - 为用户故事添加优先级标识(P0/P1/P2) - 成功指标表格化，增加测量方式和责任方 - 新增技术架构概述章节 - 完善非功能性需求：增加个人信息保护法和数据本地化要求 - 开放问题表格化，增加解决方向和决策责任人 - 新增附录：相关文档列表和缩略语表 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-01-30 22:28:21 +08:00 · 2026-01-30 22:28:21 +08:00 · 57997acd18
commit 57997acd18
parent b7779b4c86
1 changed files with 103 additions and 23 deletions
--- a/RequirementsDoc.md
+++ b/RequirementsDoc.md
@ -10,6 +10,17 @@

 ---

+## 版本历史 (Version History)
+
+| 版本 | 日期 | 作者 | 变更说明 |
+| --- | --- | --- | --- |
+| V0.1 | 2026-01-30 | - | 初稿创建 |
+| V0.2 | 2026-01-30 | Gemini | 修订用户故事、成功指标 |
+| V0.3 | 2026-01-30 | Codex | 优化合规建议 |
+| V1.0 | 2026-01-30 | Claude | 综合审核：增加优先级、技术架构、合规细化 |
+
+---
+
 ## 1. 业务背景与市场机会 (Business Context)

 ### 1.1 市场现状
@ -60,34 +71,36 @@

 ### 4.1 场景一：任务启动与规则定义

-* **[US-01]** 作为 **代理商**，我希望能够直接上传各种格式的原始 Brief（PDF扫描件、Excel分镜表、Word文档）**以及已授权的在线文档链接（如飞书/Notion分享链接）**，让系统自动提取出“核心卖点”和“禁忌词”，无需手动录入。
-* **[US-02]** 作为 **品牌方**，我希望系统能自动根据投放平台（如抖音、小红书）加载最新的平台违禁词库，确保 Brief 的要求不违反平台底线。
+* **[US-01] [P0]** 作为 **代理商**，我希望能够直接上传各种格式的原始 Brief（PDF扫描件、Excel分镜表、Word文档）**以及已授权的在线文档链接（如飞书/Notion分享链接）**，让系统自动提取出"核心卖点"和"禁忌词"，无需手动录入。
+* **[US-02] [P0]** 作为 **品牌方**，我希望系统能自动根据投放平台（如抖音、小红书）加载最新的平台违禁词库，确保 Brief 的要求不违反平台底线。

 ### 4.2 场景二：脚本预审 (Pre-production)

-* **[US-03]** 作为 **达人**，我希望在拍摄前先提交文字脚本进行预审，让系统帮我检查是否遗漏了卖点或触犯了广告法，避免拍完重拍的巨大沉没成本。
-* **[US-04]** 作为 **达人**，我希望审核系统能“读懂上下文”，不要因为我在讲故事时说了“最开心的一天”就报“广告极限词违规”，减少对创作的干扰。
+* **[US-03] [P0]** 作为 **达人**，我希望在拍摄前先提交文字脚本进行预审，让系统帮我检查是否遗漏了卖点或触犯了广告法，避免拍完重拍的巨大沉没成本。
+* **[US-04] [P1]** 作为 **达人**，我希望审核系统能"读懂上下文"，不要因为我在讲故事时说了"最开心的一天"就报"广告极限词违规"，减少对创作的干扰。

 ### 4.3 场景三：视频智能审核 (Post-production)

-* **[US-05]** 作为 **代理商**，我希望系统能自动检测视频画面中是否出现了“竞品Logo”或“不雅背景”，并精确到秒数标出来，因为人工肉眼看视频很容易走神漏掉。
-* **[US-06]** 作为 **品牌方**，我希望系统具备“舆情敏感度”，能提示达人视频中是否存在“油腻”、“爹味说教”或“性别偏见”的内容，帮助我规避潜在的公关风险（Brand Safety）。
-* **[US-07]** 作为 **达人**，我希望在视频上传后的等待期间能看到 AI 的处理进度（如“正在核对口播...”），并在审核完成后收到一份带时间戳的修改清单。
+* **[US-05] [P0]** 作为 **代理商**，我希望系统能自动检测视频画面中是否出现了"竞品Logo"或"不雅背景"，并精确到秒数标出来，因为人工肉眼看视频很容易走神漏掉。
+* **[US-06] [P1]** 作为 **品牌方**，我希望系统具备"舆情敏感度"，能提示达人视频中是否存在"油腻"、"爹味说教"或"性别偏见"的内容，帮助我规避潜在的公关风险（Brand Safety）。
+* **[US-07] [P1]** 作为 **达人**，我希望在视频上传后的等待期间能看到 AI 的处理进度（如"正在核对口播..."），并在审核完成后收到一份带时间戳的修改清单。

 ### 4.4 场景四：人工复核与决策

-* **[US-08]** 作为 **代理商审核员**，我希望在审核台看到 AI 已经标记好的风险点（红/黄/绿），我只需要点击确认或驳回，而不是从头把视频看一遍。
-* **[US-09]** 作为 **品牌方**，我希望拥有“强制通过权”，当 AI 因为过于保守而报错（例如达人玩了一个很新的梗）时，我可以手动放行，并让系统记住这个特例。
+* **[US-08] [P0]** 作为 **代理商审核员**，我希望在审核台看到 AI 已经标记好的风险点（红/黄/绿），我只需要点击确认或驳回，而不是从头把视频看一遍。
+* **[US-09] [P1]** 作为 **品牌方**，我希望拥有"强制通过权"，当 AI 因为过于保守而报错（例如达人玩了一个很新的梗）时，我可以手动放行，并让系统记住这个特例。

 ### 4.5 场景五：规则运营与审计

-* **[US-10]** 作为 **品牌方合规/法务**，我希望能配置“品牌私有规则”（如禁用词、竞品列表、白名单），并且对规则版本做可追溯的变更记录。
-* **[US-11]** 作为 **代理商**，我希望支持批量上传与批量导出审核报告，便于一次处理多条达人任务。
-* **[US-12]** 作为 **品牌方**，我希望在争议发生时能导出完整的审核证据链（时间戳、截图、规则依据、审核人）。
+* **[US-10] [P1]** 作为 **品牌方合规/法务**，我希望能配置"品牌私有规则"（如禁用词、竞品列表、白名单），并且对规则版本做可追溯的变更记录。
+* **[US-11] [P2]** 作为 **代理商**，我希望支持批量上传与批量导出审核报告，便于一次处理多条达人任务。
+* **[US-12] [P1]** 作为 **品牌方**，我希望在争议发生时能导出完整的审核证据链（时间戳、截图、规则依据、审核人）。

 ### 4.6 场景六：版本迭代与比对

-* **[US-13]** 作为 **代理商**，当达人上传修改版视频 (V2) 时，我希望看到 **“新旧版本差异报告”**，AI 明确告知“V1版本中指出的3个违规点，有2个已修复，1个未修复”，从而极大缩短复审时间。
+* **[US-13] [P2]** 作为 **代理商**，当达人上传修改版视频 (V2) 时，我希望看到 **"新旧版本差异报告"**，AI 明确告知"V1版本中指出的3个违规点，有2个已修复，1个未修复"，从而极大缩短复审时间。
+
+> **优先级说明：** P0 = MVP必须实现；P1 = 首版发布后快速迭代；P2 = 中长期规划

 ---

@ -95,13 +108,16 @@

 如果项目上线后达到以下指标，视为成功：

-1. **审核效率提升 (Efficiency):** 单条视频人工投入时长从平均 **20 分钟** 降低至 **5 分钟**（以 30 天样本统计）。
-2. **初审通过率 (Quality):** 经过 AI 脚本预审后，首次通过率提升 **≥ 30%**（对比上线前 30 天基线）。
-3. **风险拦截率 (Recall):**
-   * **硬性合规 (Hard Rules):** 针对违禁词、竞品 Logo 等客观指标，召回率 **≥ 95%**，误报率 **≤ 5%**。
-   * **软性风控 (Soft Sentiment):** 针对舆情/价值观等主观指标，**一致性**（以人工复核为基准）**≥ 80%**。
+| 指标类别 | 指标名称 | 目标值 | 测量方式 | 责任方 |
+| --- | --- | --- | --- | --- |
+| **效率 (Efficiency)** | 单条视频人工投入时长 | 从 20 分钟降至 **≤ 5 分钟** | 系统埋点统计（30 天样本） | 产品经理 |
+| **质量 (Quality)** | AI 脚本预审后首次通过率 | 提升 **≥ 30%** | 对比上线前 30 天基线 | 算法团队 |
+| **硬性召回 (Hard Rules)** | 违禁词/竞品 Logo 召回率 | **≥ 95%** | 标注测试集评估 | 算法团队 |
+| **硬性误报 (Hard Rules)** | 违禁词/竞品 Logo 误报率 | **≤ 5%** | 标注测试集评估 | 算法团队 |
+| **软性一致性 (Soft Sentiment)** | 舆情/价值观判断一致性 | **≥ 80%** | 人工复核抽样比对 | 运营团队 |
+| **用户满意度 (NPS)** | 代理商 NPS | 提升 **≥ 10 分** | 季度问卷调研 | 客户成功 |

-4. **用户满意度 (NPS):** 合作代理商的 NPS 提升 **≥ 10 分**。
+**基线数据采集计划：** 上线前 30 天内完成现有流程的数据埋点，建立各项指标的基线值。

 ---

@ -140,6 +156,40 @@

 ---

+## 7.1 技术架构概述 (Technical Architecture Overview)
+
+本节仅为高层技术选型参考，详细架构见技术设计文档。
+
+```
+┌─────────────────────────────────────────────────────────────────┐
+│                        用户接入层                                │
+│   Web Dashboard │ API Gateway │ 飞书/企微机器人 │ SDK          │
+└────────────────────────────┬────────────────────────────────────┘
+                             │
+┌────────────────────────────▼────────────────────────────────────┐
+│                        业务服务层                                │
+│  Brief 解析服务 │ 脚本预审服务 │ 视频审核服务 │ 规则管理服务     │
+└────────────────────────────┬────────────────────────────────────┘
+                             │
+┌────────────────────────────▼────────────────────────────────────┐
+│                        AI 能力层                                 │
+│  多模态 LLM │ ASR 引擎 │ OCR 引擎 │ CV 检测 │ 向量检索          │
+└────────────────────────────┬────────────────────────────────────┘
+                             │
+┌────────────────────────────▼────────────────────────────────────┐
+│                        数据与存储层                              │
+│  对象存储 (视频/图片) │ 关系数据库 │ 向量数据库 │ 消息队列       │
+└─────────────────────────────────────────────────────────────────┘
+```
+
+**核心技术依赖：**
+* **多模态大模型：** 用于语义理解、Brief 解析、舆情判断
+* **ASR/OCR：** 支持普通话及主流方言的语音识别，支持复杂背景字幕识别
+* **计算机视觉：** Logo 检测、物体识别、场景分类
+* **消息队列：** 异步处理视频审核任务，支持优先级调度
+
+---
+
 ## 8. 非功能性需求 (Non-Functional Requirements)

 * **可用性:** 月度可用性 ≥ 99.5%，支持灰度发布与快速回滚。
@ -147,6 +197,8 @@
 * **安全:** 传输与存储加密；基于角色的权限控制；关键操作二次确认。
 * **数据保留:** 默认保留原始视频/报告 30 天，可按品牌配置延长或缩短。
 * **合规与隐私:** 支持数据脱敏与最小化访问；操作日志可审计且不可篡改。
+* **个人信息保护:** 符合《个人信息保护法》及 GDPR 要求；用户数据可导出、可删除；明确告知数据用途。
+* **数据本地化:** 国内客户数据存储于中国大陆境内服务器；跨境传输需用户明示同意并符合监管要求。

 ---

@ -173,7 +225,35 @@

 ### 10.2 开放问题 (Open Questions)

-* **规则迭代频率：** 是否需要与平台建立订阅机制，规则更新 SLA 如何定义？
-* **训练数据来源：** 标注成本、数据授权路径与敏感数据脱敏策略如何确定？
-* **舆情判断边界：** “油腻/爹味”等主观标签需要谁来兜底决策？
-* **多语言支持：** 海外投放或多语种内容是否纳入本期范围？
+| 问题 | 详细描述 | 建议解决方向 | 决策责任人 |
+| --- | --- | --- | --- |
+| **规则迭代频率** | 平台规则变更频繁，如何确保及时同步？ | 建立官方公告订阅 + 人工值班巡检，SLA ≤ 1 工作日 | 运营负责人 |
+| **训练数据来源** | 标注成本高、数据授权复杂、敏感数据脱敏 | 优先使用品牌方授权的历史审核数据，建立数据脱敏 Pipeline | 算法 + 法务 |
+| **舆情判断边界** | "油腻/爹味"等主观标签由谁最终定义？ | 建立"品牌方确认"机制，软性风控仅作提示，不作为强制拦截 | 产品经理 |
+| **多语言支持** | 海外投放需支持英语、日语等 | 本期仅支持中文（普通话 + 主流方言），多语言作为 V2 规划 | 产品经理 |
+| **模型幻觉风险** | LLM 可能产生不准确的审核结论 | 关键判断必须提供证据片段，人工复核覆盖高风险内容 | 算法团队 |
+| **定价与商业模式** | 按视频条数、时长还是座席收费？ | 待商业化团队确定，技术架构需支持多种计费维度 | 商业化负责人 |
+
+---
+
+## 11. 附录 (Appendix)
+
+### 11.1 相关文档
+
+* 技术设计文档 (TDD) - 待编写
+* API 接口规范 - 待编写
+* 数据字典 - 待编写
+* 测试计划 - 待编写
+
+### 11.2 缩略语
+
+| 缩略语 | 全称 | 说明 |
+| --- | --- | --- |
+| ASR | Automatic Speech Recognition | 自动语音识别 |
+| OCR | Optical Character Recognition | 光学字符识别 |
+| CV | Computer Vision | 计算机视觉 |
+| NLP | Natural Language Processing | 自然语言处理 |
+| LLM | Large Language Model | 大语言模型 |
+| NPS | Net Promoter Score | 净推荐值 |
+| SLA | Service Level Agreement | 服务级别协议 |
+| GDPR | General Data Protection Regulation | 通用数据保护条例（欧盟） |