diff --git a/RequirementsDoc.md b/RequirementsDoc.md index 1216843..5f776d7 100644 --- a/RequirementsDoc.md +++ b/RequirementsDoc.md @@ -10,6 +10,17 @@ --- +## 版本历史 (Version History) + +| 版本 | 日期 | 作者 | 变更说明 | +| --- | --- | --- | --- | +| V0.1 | 2026-01-30 | - | 初稿创建 | +| V0.2 | 2026-01-30 | Gemini | 修订用户故事、成功指标 | +| V0.3 | 2026-01-30 | Codex | 优化合规建议 | +| V1.0 | 2026-01-30 | Claude | 综合审核:增加优先级、技术架构、合规细化 | + +--- + ## 1. 业务背景与市场机会 (Business Context) ### 1.1 市场现状 @@ -60,34 +71,36 @@ ### 4.1 场景一:任务启动与规则定义 -* **[US-01]** 作为 **代理商**,我希望能够直接上传各种格式的原始 Brief(PDF扫描件、Excel分镜表、Word文档)**以及已授权的在线文档链接(如飞书/Notion分享链接)**,让系统自动提取出“核心卖点”和“禁忌词”,无需手动录入。 -* **[US-02]** 作为 **品牌方**,我希望系统能自动根据投放平台(如抖音、小红书)加载最新的平台违禁词库,确保 Brief 的要求不违反平台底线。 +* **[US-01] [P0]** 作为 **代理商**,我希望能够直接上传各种格式的原始 Brief(PDF扫描件、Excel分镜表、Word文档)**以及已授权的在线文档链接(如飞书/Notion分享链接)**,让系统自动提取出"核心卖点"和"禁忌词",无需手动录入。 +* **[US-02] [P0]** 作为 **品牌方**,我希望系统能自动根据投放平台(如抖音、小红书)加载最新的平台违禁词库,确保 Brief 的要求不违反平台底线。 ### 4.2 场景二:脚本预审 (Pre-production) -* **[US-03]** 作为 **达人**,我希望在拍摄前先提交文字脚本进行预审,让系统帮我检查是否遗漏了卖点或触犯了广告法,避免拍完重拍的巨大沉没成本。 -* **[US-04]** 作为 **达人**,我希望审核系统能“读懂上下文”,不要因为我在讲故事时说了“最开心的一天”就报“广告极限词违规”,减少对创作的干扰。 +* **[US-03] [P0]** 作为 **达人**,我希望在拍摄前先提交文字脚本进行预审,让系统帮我检查是否遗漏了卖点或触犯了广告法,避免拍完重拍的巨大沉没成本。 +* **[US-04] [P1]** 作为 **达人**,我希望审核系统能"读懂上下文",不要因为我在讲故事时说了"最开心的一天"就报"广告极限词违规",减少对创作的干扰。 ### 4.3 场景三:视频智能审核 (Post-production) -* **[US-05]** 作为 **代理商**,我希望系统能自动检测视频画面中是否出现了“竞品Logo”或“不雅背景”,并精确到秒数标出来,因为人工肉眼看视频很容易走神漏掉。 -* **[US-06]** 作为 **品牌方**,我希望系统具备“舆情敏感度”,能提示达人视频中是否存在“油腻”、“爹味说教”或“性别偏见”的内容,帮助我规避潜在的公关风险(Brand Safety)。 -* **[US-07]** 作为 **达人**,我希望在视频上传后的等待期间能看到 AI 的处理进度(如“正在核对口播...”),并在审核完成后收到一份带时间戳的修改清单。 +* **[US-05] [P0]** 作为 **代理商**,我希望系统能自动检测视频画面中是否出现了"竞品Logo"或"不雅背景",并精确到秒数标出来,因为人工肉眼看视频很容易走神漏掉。 +* **[US-06] [P1]** 作为 **品牌方**,我希望系统具备"舆情敏感度",能提示达人视频中是否存在"油腻"、"爹味说教"或"性别偏见"的内容,帮助我规避潜在的公关风险(Brand Safety)。 +* **[US-07] [P1]** 作为 **达人**,我希望在视频上传后的等待期间能看到 AI 的处理进度(如"正在核对口播..."),并在审核完成后收到一份带时间戳的修改清单。 ### 4.4 场景四:人工复核与决策 -* **[US-08]** 作为 **代理商审核员**,我希望在审核台看到 AI 已经标记好的风险点(红/黄/绿),我只需要点击确认或驳回,而不是从头把视频看一遍。 -* **[US-09]** 作为 **品牌方**,我希望拥有“强制通过权”,当 AI 因为过于保守而报错(例如达人玩了一个很新的梗)时,我可以手动放行,并让系统记住这个特例。 +* **[US-08] [P0]** 作为 **代理商审核员**,我希望在审核台看到 AI 已经标记好的风险点(红/黄/绿),我只需要点击确认或驳回,而不是从头把视频看一遍。 +* **[US-09] [P1]** 作为 **品牌方**,我希望拥有"强制通过权",当 AI 因为过于保守而报错(例如达人玩了一个很新的梗)时,我可以手动放行,并让系统记住这个特例。 ### 4.5 场景五:规则运营与审计 -* **[US-10]** 作为 **品牌方合规/法务**,我希望能配置“品牌私有规则”(如禁用词、竞品列表、白名单),并且对规则版本做可追溯的变更记录。 -* **[US-11]** 作为 **代理商**,我希望支持批量上传与批量导出审核报告,便于一次处理多条达人任务。 -* **[US-12]** 作为 **品牌方**,我希望在争议发生时能导出完整的审核证据链(时间戳、截图、规则依据、审核人)。 +* **[US-10] [P1]** 作为 **品牌方合规/法务**,我希望能配置"品牌私有规则"(如禁用词、竞品列表、白名单),并且对规则版本做可追溯的变更记录。 +* **[US-11] [P2]** 作为 **代理商**,我希望支持批量上传与批量导出审核报告,便于一次处理多条达人任务。 +* **[US-12] [P1]** 作为 **品牌方**,我希望在争议发生时能导出完整的审核证据链(时间戳、截图、规则依据、审核人)。 ### 4.6 场景六:版本迭代与比对 -* **[US-13]** 作为 **代理商**,当达人上传修改版视频 (V2) 时,我希望看到 **“新旧版本差异报告”**,AI 明确告知“V1版本中指出的3个违规点,有2个已修复,1个未修复”,从而极大缩短复审时间。 +* **[US-13] [P2]** 作为 **代理商**,当达人上传修改版视频 (V2) 时,我希望看到 **"新旧版本差异报告"**,AI 明确告知"V1版本中指出的3个违规点,有2个已修复,1个未修复",从而极大缩短复审时间。 + +> **优先级说明:** P0 = MVP必须实现;P1 = 首版发布后快速迭代;P2 = 中长期规划 --- @@ -95,13 +108,16 @@ 如果项目上线后达到以下指标,视为成功: -1. **审核效率提升 (Efficiency):** 单条视频人工投入时长从平均 **20 分钟** 降低至 **5 分钟**(以 30 天样本统计)。 -2. **初审通过率 (Quality):** 经过 AI 脚本预审后,首次通过率提升 **≥ 30%**(对比上线前 30 天基线)。 -3. **风险拦截率 (Recall):** - * **硬性合规 (Hard Rules):** 针对违禁词、竞品 Logo 等客观指标,召回率 **≥ 95%**,误报率 **≤ 5%**。 - * **软性风控 (Soft Sentiment):** 针对舆情/价值观等主观指标,**一致性**(以人工复核为基准)**≥ 80%**。 +| 指标类别 | 指标名称 | 目标值 | 测量方式 | 责任方 | +| --- | --- | --- | --- | --- | +| **效率 (Efficiency)** | 单条视频人工投入时长 | 从 20 分钟降至 **≤ 5 分钟** | 系统埋点统计(30 天样本) | 产品经理 | +| **质量 (Quality)** | AI 脚本预审后首次通过率 | 提升 **≥ 30%** | 对比上线前 30 天基线 | 算法团队 | +| **硬性召回 (Hard Rules)** | 违禁词/竞品 Logo 召回率 | **≥ 95%** | 标注测试集评估 | 算法团队 | +| **硬性误报 (Hard Rules)** | 违禁词/竞品 Logo 误报率 | **≤ 5%** | 标注测试集评估 | 算法团队 | +| **软性一致性 (Soft Sentiment)** | 舆情/价值观判断一致性 | **≥ 80%** | 人工复核抽样比对 | 运营团队 | +| **用户满意度 (NPS)** | 代理商 NPS | 提升 **≥ 10 分** | 季度问卷调研 | 客户成功 | -4. **用户满意度 (NPS):** 合作代理商的 NPS 提升 **≥ 10 分**。 +**基线数据采集计划:** 上线前 30 天内完成现有流程的数据埋点,建立各项指标的基线值。 --- @@ -140,6 +156,40 @@ --- +## 7.1 技术架构概述 (Technical Architecture Overview) + +本节仅为高层技术选型参考,详细架构见技术设计文档。 + +``` +┌─────────────────────────────────────────────────────────────────┐ +│ 用户接入层 │ +│ Web Dashboard │ API Gateway │ 飞书/企微机器人 │ SDK │ +└────────────────────────────┬────────────────────────────────────┘ + │ +┌────────────────────────────▼────────────────────────────────────┐ +│ 业务服务层 │ +│ Brief 解析服务 │ 脚本预审服务 │ 视频审核服务 │ 规则管理服务 │ +└────────────────────────────┬────────────────────────────────────┘ + │ +┌────────────────────────────▼────────────────────────────────────┐ +│ AI 能力层 │ +│ 多模态 LLM │ ASR 引擎 │ OCR 引擎 │ CV 检测 │ 向量检索 │ +└────────────────────────────┬────────────────────────────────────┘ + │ +┌────────────────────────────▼────────────────────────────────────┐ +│ 数据与存储层 │ +│ 对象存储 (视频/图片) │ 关系数据库 │ 向量数据库 │ 消息队列 │ +└─────────────────────────────────────────────────────────────────┘ +``` + +**核心技术依赖:** +* **多模态大模型:** 用于语义理解、Brief 解析、舆情判断 +* **ASR/OCR:** 支持普通话及主流方言的语音识别,支持复杂背景字幕识别 +* **计算机视觉:** Logo 检测、物体识别、场景分类 +* **消息队列:** 异步处理视频审核任务,支持优先级调度 + +--- + ## 8. 非功能性需求 (Non-Functional Requirements) * **可用性:** 月度可用性 ≥ 99.5%,支持灰度发布与快速回滚。 @@ -147,6 +197,8 @@ * **安全:** 传输与存储加密;基于角色的权限控制;关键操作二次确认。 * **数据保留:** 默认保留原始视频/报告 30 天,可按品牌配置延长或缩短。 * **合规与隐私:** 支持数据脱敏与最小化访问;操作日志可审计且不可篡改。 +* **个人信息保护:** 符合《个人信息保护法》及 GDPR 要求;用户数据可导出、可删除;明确告知数据用途。 +* **数据本地化:** 国内客户数据存储于中国大陆境内服务器;跨境传输需用户明示同意并符合监管要求。 --- @@ -173,7 +225,35 @@ ### 10.2 开放问题 (Open Questions) -* **规则迭代频率:** 是否需要与平台建立订阅机制,规则更新 SLA 如何定义? -* **训练数据来源:** 标注成本、数据授权路径与敏感数据脱敏策略如何确定? -* **舆情判断边界:** “油腻/爹味”等主观标签需要谁来兜底决策? -* **多语言支持:** 海外投放或多语种内容是否纳入本期范围? +| 问题 | 详细描述 | 建议解决方向 | 决策责任人 | +| --- | --- | --- | --- | +| **规则迭代频率** | 平台规则变更频繁,如何确保及时同步? | 建立官方公告订阅 + 人工值班巡检,SLA ≤ 1 工作日 | 运营负责人 | +| **训练数据来源** | 标注成本高、数据授权复杂、敏感数据脱敏 | 优先使用品牌方授权的历史审核数据,建立数据脱敏 Pipeline | 算法 + 法务 | +| **舆情判断边界** | "油腻/爹味"等主观标签由谁最终定义? | 建立"品牌方确认"机制,软性风控仅作提示,不作为强制拦截 | 产品经理 | +| **多语言支持** | 海外投放需支持英语、日语等 | 本期仅支持中文(普通话 + 主流方言),多语言作为 V2 规划 | 产品经理 | +| **模型幻觉风险** | LLM 可能产生不准确的审核结论 | 关键判断必须提供证据片段,人工复核覆盖高风险内容 | 算法团队 | +| **定价与商业模式** | 按视频条数、时长还是座席收费? | 待商业化团队确定,技术架构需支持多种计费维度 | 商业化负责人 | + +--- + +## 11. 附录 (Appendix) + +### 11.1 相关文档 + +* 技术设计文档 (TDD) - 待编写 +* API 接口规范 - 待编写 +* 数据字典 - 待编写 +* 测试计划 - 待编写 + +### 11.2 缩略语 + +| 缩略语 | 全称 | 说明 | +| --- | --- | --- | +| ASR | Automatic Speech Recognition | 自动语音识别 | +| OCR | Optical Character Recognition | 光学字符识别 | +| CV | Computer Vision | 计算机视觉 | +| NLP | Natural Language Processing | 自然语言处理 | +| LLM | Large Language Model | 大语言模型 | +| NPS | Net Promoter Score | 净推荐值 | +| SLA | Service Level Agreement | 服务级别协议 | +| GDPR | General Data Protection Regulation | 通用数据保护条例(欧盟) |