From ef08986c7c61d054f967b891e2c82eb80e2cfd0b Mon Sep 17 00:00:00 2001
From: Your Name <you@example.com>
Date: Fri, 30 Jan 2026 21:59:29 +0800
Subject: [PATCH] review gemini revisions

---
 RequirementsDoc.md | 69 ++++++++++++++++++++--------------------------
 1 file changed, 30 insertions(+), 39 deletions(-)

diff --git a/RequirementsDoc.md b/RequirementsDoc.md
index 036cfdc..dd4f647 100644
--- a/RequirementsDoc.md
+++ b/RequirementsDoc.md
@@ -5,7 +5,7 @@
 | **项目名称** | SmartAudit (AI 营销内容合规审核平台) |
 | **版本号** | V1.0 |
 | **发布日期** | 2026-01-30 |
-| **状态** | 草稿 (Draft) |
+| **状态** | **修订 (Revised)** |
 | **侧重** | 商业背景、用户价值、用户故事、成功指标 |
 
 ---
@@ -39,6 +39,7 @@
 * **初审通过率：** 仅经过 AI 预审后一次性通过的比例（不进入人工返工）。
 * **召回率/误报率：** 在标注测试集中，系统识别到“确实违规”的比例 / 误判为违规的比例。
 * **Brand Safety：** 涉及价值观、偏见、歧视、舆情争议等非硬性违规风险。
+* **版本比对 (Diff)：** 针对同一任务的不同版本视频，自动识别修改点和未修改点的能力。
 
 ---
 
@@ -56,33 +57,37 @@
 
 我们将需求拆解为具体的场景故事，以确保功能设计满足真实业务流。
 
-### 3.1 场景一：任务启动与规则定义
+### 4.1 场景一：任务启动与规则定义
 
-* **[US-01]** 作为 **代理商**，我希望能够直接上传各种格式的原始 Brief（PDF扫描件、Excel分镜表、Word文档），让系统自动提取出“核心卖点”和“禁忌词”，而不需要我手动一条条录入，以节省配置时间。
+* **[US-01]** 作为 **代理商**，我希望能够直接上传各种格式的原始 Brief（PDF扫描件、Excel分镜表、Word文档）**以及已授权的在线文档链接（如飞书/Notion分享链接）**，让系统自动提取出“核心卖点”和“禁忌词”，无需手动录入。
 * **[US-02]** 作为 **品牌方**，我希望系统能自动根据投放平台（如抖音、小红书）加载最新的平台违禁词库，确保 Brief 的要求不违反平台底线。
 
-### 3.2 场景二：脚本预审 (Pre-production)
+### 4.2 场景二：脚本预审 (Pre-production)
 
 * **[US-03]** 作为 **达人**，我希望在拍摄前先提交文字脚本进行预审，让系统帮我检查是否遗漏了卖点或触犯了广告法，避免拍完重拍的巨大沉没成本。
 * **[US-04]** 作为 **达人**，我希望审核系统能“读懂上下文”，不要因为我在讲故事时说了“最开心的一天”就报“广告极限词违规”，减少对创作的干扰。
 
-### 3.3 场景三：视频智能审核 (Post-production)
+### 4.3 场景三：视频智能审核 (Post-production)
 
 * **[US-05]** 作为 **代理商**，我希望系统能自动检测视频画面中是否出现了“竞品Logo”或“不雅背景”，并精确到秒数标出来，因为人工肉眼看视频很容易走神漏掉。
 * **[US-06]** 作为 **品牌方**，我希望系统具备“舆情敏感度”，能提示达人视频中是否存在“油腻”、“爹味说教”或“性别偏见”的内容，帮助我规避潜在的公关风险（Brand Safety）。
 * **[US-07]** 作为 **达人**，我希望在视频上传后的等待期间能看到 AI 的处理进度（如“正在核对口播...”），并在审核完成后收到一份带时间戳的修改清单。
 
-### 3.4 场景四：人工复核与决策
+### 4.4 场景四：人工复核与决策
 
 * **[US-08]** 作为 **代理商审核员**，我希望在审核台看到 AI 已经标记好的风险点（红/黄/绿），我只需要点击确认或驳回，而不是从头把视频看一遍。
 * **[US-09]** 作为 **品牌方**，我希望拥有“强制通过权”，当 AI 因为过于保守而报错（例如达人玩了一个很新的梗）时，我可以手动放行，并让系统记住这个特例。
 
-### 3.5 场景五：规则运营与审计
+### 4.5 场景五：规则运营与审计
 
 * **[US-10]** 作为 **品牌方合规/法务**，我希望能配置“品牌私有规则”（如禁用词、竞品列表、白名单），并且对规则版本做可追溯的变更记录。
 * **[US-11]** 作为 **代理商**，我希望支持批量上传与批量导出审核报告，便于一次处理多条达人任务。
 * **[US-12]** 作为 **品牌方**，我希望在争议发生时能导出完整的审核证据链（时间戳、截图、规则依据、审核人）。
 
+### 4.6 场景六：版本迭代与比对
+
+* **[US-13]** 作为 **代理商**，当达人上传修改版视频 (V2) 时，我希望看到 **“新旧版本差异报告”**，AI 明确告知“V1版本中指出的3个违规点，有2个已修复，1个未修复”，从而极大缩短复审时间。
+
 ---
 
 ## 5. 成功指标 (Success Metrics / KPIs)
@@ -91,18 +96,19 @@
 
 1. **审核效率提升 (Efficiency):** 单条视频人工投入时长从平均 **20 分钟** 降低至 **5 分钟**（以 30 天样本统计）。
 2. **初审通过率 (Quality):** 经过 AI 脚本预审后，首次通过率提升 **≥ 30%**（对比上线前 30 天基线）。
-3. **风险拦截率 (Recall):** 在标注测试集中，硬性合规问题召回率 **≥ 95%**，同时误报率 **≤ 5%**。
+3. **风险拦截率 (Recall):**
+   * **硬性合规 (Hard Rules):** 针对违禁词、竞品 Logo 等客观指标，召回率 **≥ 95%**，误报率 **≤ 5%**。
+   * **软性风控 (Soft Sentiment):** 针对舆情/价值观等主观指标，**一致性**（与人工复核结论一致）**≥ 80%**。
+
 4. **用户满意度 (NPS):** 合作代理商的 NPS 提升 **≥ 10 分**。
 
 ---
 
 ## 6. 高层功能列表 (High-Level Features)
 
-本部分定义项目的**范围 (Scope)**，明确做什么，不做什么。
-
 ### ✅ In Scope (核心功能)
 
-1. **全能文档解析引擎:** 支持 PDF/Word/Excel/PPT/图片 的 Brief 自动解析与规则结构化。
+1. **全能文档解析引擎:** 支持 PDF/Word/Excel/PPT/图片/在线链接 的 Brief 自动解析与规则结构化。
 2. **多模态审核核心:** 包含 NLP (文本/语义)、ASR (语音)、OCR (字幕)、CV (画面/物体) 综合检测能力。
 3. **分区执法逻辑:** 智能区分“广告段”与“剧情段”，应用不同的审核尺度。
 4. **舆情风控雷达:** 针对“油腻感”、“价值观风险”、“错别字”的专项检测模型。
@@ -116,8 +122,9 @@
 
 1. **视频剪辑工具:** 不提供在线剪辑功能，仅提供修改意见。
 2. **支付与结算:** 不涉及品牌与达人的资金交易。
-3. **发布后数据监测:** 不负责视频发布后的点赞/评论/转化数据分析（那是星图/蒲公英平台的事）。
+3. **发布后数据监测:** 不负责视频发布后的点赞/评论/转化数据分析。
 4. **自动下架/投诉处理:** 不直接触发平台处罚或下架动作。
+5. **直播流/实时切片审核:** 本期仅支持离线上传视频文件，不支持直播流的实时接入与毫秒级审核。
 
 ---
 
@@ -127,7 +134,8 @@
 * **数据隐私:** 品牌方的 Brief 和私有数据必须严格隔离，不得用于训练通用模型。
 * **平台依赖:** 若抖音/小红书的审核规则发生重大变更，系统需在一个工作日内更新规则库。
 * **规则来源:** 具体合规规则由品牌/法务提供并确认，平台规则以官方公告为准。
-* **可解释性:** 所有违规提示需给出规则依据与证据片段，便于人工复核。
+* **在线文档接入:** 仅支持用户授权的分享链接；不得绕过权限或抓取受限内容。
+* **区域合规:** 不同地区投放需切换对应法规与平台规则版本。
 
 ---
 
@@ -137,7 +145,7 @@
 * **性能:** 1080p、≤ 100MB 视频生成报告 ≤ 5 分钟（排队时间不超过 2 分钟）。
 * **安全:** 传输与存储加密；基于角色的权限控制；关键操作二次确认。
 * **数据保留:** 默认保留原始视频/报告 30 天，可按品牌配置延长或缩短。
-* **可观测性:** 关键路径日志、指标、告警齐全（失败率、处理时延、模型版本）。
+* **合规与隐私:** 支持数据脱敏与最小化访问；操作日志可审计且不可篡改。
 
 ---
 
@@ -152,36 +160,19 @@
 
 ---
 
-## 10. 合规建议与开放问题 (Compliance Suggestions & Open Questions)
+## 10. 风险与合规原则 (Risks & Compliance Principles)
 
-### 10.1 合规建议（与 Gemini 建议对齐后的版本）
+### 10.1 系统合规性原则
 
-* **规则来源合规：** 平台规则仅以官方公告/接口为准；不做未经授权的自动抓取；规则变更需留痕与可回滚。
-* **人类最终裁决：** 对主观风险（价值观、舆情、偏见）必须保留人工复核入口，系统仅提供证据与建议等级。
-* **可解释与可申诉：** 每条结论必须给出证据片段与规则依据，并支持申诉与人工仲裁。
+* **规则来源合法：** 所有审核标准均需基于公开法律法规、平台官方规则或品牌方授权的私有 Brief；不得未经授权抓取或绕过登录限制。
+* **可解释与可申诉：** AI 不做黑盒决策，每条结论必须给出证据片段与规则依据，并支持申诉与人工仲裁。
 * **数据授权与最小化：** 训练与评测数据需确保授权合规；默认最小化留存，过期自动清理。
-* **不自动处罚：** 系统只输出建议，不直接触发下架、投诉或平台处罚动作。
+* **辅助决策定位：** 系统明确定义为“辅助工具”，不直接触发下架、投诉或平台处罚动作，最终责任由人工操作员承担。
+* **偏见与歧视控制：** 涉及主观评价的模型需经过偏见评估与定期复核，确保结论可解释且可追溯。
 
-### 10.2 开放问题
+### 10.2 开放问题 (Open Questions)
 
 * **规则迭代频率：** 是否需要与平台建立订阅机制，规则更新 SLA 如何定义？
 * **训练数据来源：** 标注成本、数据授权路径与敏感数据脱敏策略如何确定？
-* **舆情判断边界：** 主观标签由谁定标？品牌侧与代理侧冲突如何仲裁？
+* **舆情判断边界：** “油腻/爹味”等主观标签需要谁来兜底决策？
 * **多语言支持：** 海外投放或多语种内容是否纳入本期范围？
-修改 1：优化《5. 成功指标》
-5. 成功指标 (Success Metrics / KPIs) ... 3. 风险拦截率 (Recall):
-
-硬性合规 (Hard Rules): 针对违禁词、竞品 Logo 等客观指标，召回率 ≥ 95%。
-
-软性风控 (Soft Sentiment): 针对油腻感、价值观等主观指标，用户认可度/准确率 ≥ 80%。 ...
-
-修改 2：明确《6. High-Level Features》的范围
-6. High-Level Features ... ❌ Out of Scope (本期不做) ... 4. 自动下架/投诉处理: 不直接触发平台处罚或下架动作。 5. 直播流/实时切片审核: 本期仅支持离线上传视频文件，不支持直播流的实时接入与毫秒级审核。
-
-修改 3：补充 User Story 到《4. 用户故事》
-3.6 场景六：版本迭代与比对 (New)
-
-[US-13] 作为 代理商，当达人上传修改版视频 (V2) 时，我希望看到 “新旧版本差异报告”，AI 明确告知“V1版本中指出的3个违规点，有2个已修复，1个未修复”，从而极大缩短复审时间。
-
-修改 4：补充 Brief 来源支持
-[US-01] ...支持上传各种格式的原始 Brief（PDF、Word...）以及主流在线文档链接（如飞书/Notion公开链接）...