综合审核并完善需求文档

- 增加版本历史追踪文档变更
- 为用户故事添加优先级标识(P0/P1/P2)
- 成功指标表格化,增加测量方式和责任方
- 新增技术架构概述章节
- 完善非功能性需求:增加个人信息保护法和数据本地化要求
- 开放问题表格化,增加解决方向和决策责任人
- 新增附录:相关文档列表和缩略语表

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
This commit is contained in:
Your Name 2026-01-30 22:28:21 +08:00
parent b7779b4c86
commit 57997acd18

View File

@ -10,6 +10,17 @@
---
## 版本历史 (Version History)
| 版本 | 日期 | 作者 | 变更说明 |
| --- | --- | --- | --- |
| V0.1 | 2026-01-30 | - | 初稿创建 |
| V0.2 | 2026-01-30 | Gemini | 修订用户故事、成功指标 |
| V0.3 | 2026-01-30 | Codex | 优化合规建议 |
| V1.0 | 2026-01-30 | Claude | 综合审核:增加优先级、技术架构、合规细化 |
---
## 1. 业务背景与市场机会 (Business Context)
### 1.1 市场现状
@ -60,34 +71,36 @@
### 4.1 场景一:任务启动与规则定义
* **[US-01]** 作为 **代理商**,我希望能够直接上传各种格式的原始 BriefPDF扫描件、Excel分镜表、Word文档**以及已授权的在线文档链接(如飞书/Notion分享链接**,让系统自动提取出“核心卖点”和“禁忌词”,无需手动录入。
* **[US-02]** 作为 **品牌方**,我希望系统能自动根据投放平台(如抖音、小红书)加载最新的平台违禁词库,确保 Brief 的要求不违反平台底线。
* **[US-01] [P0]** 作为 **代理商**,我希望能够直接上传各种格式的原始 BriefPDF扫描件、Excel分镜表、Word文档**以及已授权的在线文档链接(如飞书/Notion分享链接**,让系统自动提取出"核心卖点"和"禁忌词",无需手动录入。
* **[US-02] [P0]** 作为 **品牌方**,我希望系统能自动根据投放平台(如抖音、小红书)加载最新的平台违禁词库,确保 Brief 的要求不违反平台底线。
### 4.2 场景二:脚本预审 (Pre-production)
* **[US-03]** 作为 **达人**,我希望在拍摄前先提交文字脚本进行预审,让系统帮我检查是否遗漏了卖点或触犯了广告法,避免拍完重拍的巨大沉没成本。
* **[US-04]** 作为 **达人**,我希望审核系统能“读懂上下文”,不要因为我在讲故事时说了“最开心的一天”就报“广告极限词违规”,减少对创作的干扰。
* **[US-03] [P0]** 作为 **达人**,我希望在拍摄前先提交文字脚本进行预审,让系统帮我检查是否遗漏了卖点或触犯了广告法,避免拍完重拍的巨大沉没成本。
* **[US-04] [P1]** 作为 **达人**,我希望审核系统能"读懂上下文",不要因为我在讲故事时说了"最开心的一天"就报"广告极限词违规",减少对创作的干扰。
### 4.3 场景三:视频智能审核 (Post-production)
* **[US-05]** 作为 **代理商**,我希望系统能自动检测视频画面中是否出现了“竞品Logo”或“不雅背景”,并精确到秒数标出来,因为人工肉眼看视频很容易走神漏掉。
* **[US-06]** 作为 **品牌方**,我希望系统具备“舆情敏感度”,能提示达人视频中是否存在“油腻”、“爹味说教”或“性别偏见”的内容帮助我规避潜在的公关风险Brand Safety
* **[US-07]** 作为 **达人**,我希望在视频上传后的等待期间能看到 AI 的处理进度(如“正在核对口播...”),并在审核完成后收到一份带时间戳的修改清单。
* **[US-05] [P0]** 作为 **代理商**,我希望系统能自动检测视频画面中是否出现了"竞品Logo"或"不雅背景",并精确到秒数标出来,因为人工肉眼看视频很容易走神漏掉。
* **[US-06] [P1]** 作为 **品牌方**,我希望系统具备"舆情敏感度",能提示达人视频中是否存在"油腻"、"爹味说教"或"性别偏见"的内容帮助我规避潜在的公关风险Brand Safety
* **[US-07] [P1]** 作为 **达人**,我希望在视频上传后的等待期间能看到 AI 的处理进度(如"正在核对口播..."),并在审核完成后收到一份带时间戳的修改清单。
### 4.4 场景四:人工复核与决策
* **[US-08]** 作为 **代理商审核员**,我希望在审核台看到 AI 已经标记好的风险点(红/黄/绿),我只需要点击确认或驳回,而不是从头把视频看一遍。
* **[US-09]** 作为 **品牌方**,我希望拥有“强制通过权”,当 AI 因为过于保守而报错(例如达人玩了一个很新的梗)时,我可以手动放行,并让系统记住这个特例。
* **[US-08] [P0]** 作为 **代理商审核员**,我希望在审核台看到 AI 已经标记好的风险点(红/黄/绿),我只需要点击确认或驳回,而不是从头把视频看一遍。
* **[US-09] [P1]** 作为 **品牌方**,我希望拥有"强制通过权",当 AI 因为过于保守而报错(例如达人玩了一个很新的梗)时,我可以手动放行,并让系统记住这个特例。
### 4.5 场景五:规则运营与审计
* **[US-10]** 作为 **品牌方合规/法务**,我希望能配置“品牌私有规则”(如禁用词、竞品列表、白名单),并且对规则版本做可追溯的变更记录。
* **[US-11]** 作为 **代理商**,我希望支持批量上传与批量导出审核报告,便于一次处理多条达人任务。
* **[US-12]** 作为 **品牌方**,我希望在争议发生时能导出完整的审核证据链(时间戳、截图、规则依据、审核人)。
* **[US-10] [P1]** 作为 **品牌方合规/法务**,我希望能配置"品牌私有规则"(如禁用词、竞品列表、白名单),并且对规则版本做可追溯的变更记录。
* **[US-11] [P2]** 作为 **代理商**,我希望支持批量上传与批量导出审核报告,便于一次处理多条达人任务。
* **[US-12] [P1]** 作为 **品牌方**,我希望在争议发生时能导出完整的审核证据链(时间戳、截图、规则依据、审核人)。
### 4.6 场景六:版本迭代与比对
* **[US-13]** 作为 **代理商**,当达人上传修改版视频 (V2) 时,我希望看到 **“新旧版本差异报告”**AI 明确告知“V1版本中指出的3个违规点有2个已修复1个未修复”从而极大缩短复审时间。
* **[US-13] [P2]** 作为 **代理商**,当达人上传修改版视频 (V2) 时,我希望看到 **"新旧版本差异报告"**AI 明确告知"V1版本中指出的3个违规点有2个已修复1个未修复",从而极大缩短复审时间。
> **优先级说明:** P0 = MVP必须实现P1 = 首版发布后快速迭代P2 = 中长期规划
---
@ -95,13 +108,16 @@
如果项目上线后达到以下指标,视为成功:
1. **审核效率提升 (Efficiency):** 单条视频人工投入时长从平均 **20 分钟** 降低至 **5 分钟**(以 30 天样本统计)。
2. **初审通过率 (Quality):** 经过 AI 脚本预审后,首次通过率提升 **≥ 30%**(对比上线前 30 天基线)。
3. **风险拦截率 (Recall):**
* **硬性合规 (Hard Rules):** 针对违禁词、竞品 Logo 等客观指标,召回率 **≥ 95%**,误报率 **≤ 5%**。
* **软性风控 (Soft Sentiment):** 针对舆情/价值观等主观指标,**一致性**(以人工复核为基准)**≥ 80%**。
| 指标类别 | 指标名称 | 目标值 | 测量方式 | 责任方 |
| --- | --- | --- | --- | --- |
| **效率 (Efficiency)** | 单条视频人工投入时长 | 从 20 分钟降至 **≤ 5 分钟** | 系统埋点统计30 天样本) | 产品经理 |
| **质量 (Quality)** | AI 脚本预审后首次通过率 | 提升 **≥ 30%** | 对比上线前 30 天基线 | 算法团队 |
| **硬性召回 (Hard Rules)** | 违禁词/竞品 Logo 召回率 | **≥ 95%** | 标注测试集评估 | 算法团队 |
| **硬性误报 (Hard Rules)** | 违禁词/竞品 Logo 误报率 | **≤ 5%** | 标注测试集评估 | 算法团队 |
| **软性一致性 (Soft Sentiment)** | 舆情/价值观判断一致性 | **≥ 80%** | 人工复核抽样比对 | 运营团队 |
| **用户满意度 (NPS)** | 代理商 NPS | 提升 **≥ 10 分** | 季度问卷调研 | 客户成功 |
4. **用户满意度 (NPS):** 合作代理商的 NPS 提升 **≥ 10 分**。
**基线数据采集计划:** 上线前 30 天内完成现有流程的数据埋点,建立各项指标的基线值
---
@ -140,6 +156,40 @@
---
## 7.1 技术架构概述 (Technical Architecture Overview)
本节仅为高层技术选型参考,详细架构见技术设计文档。
```
┌─────────────────────────────────────────────────────────────────┐
│ 用户接入层 │
│ Web Dashboard │ API Gateway │ 飞书/企微机器人 │ SDK │
└────────────────────────────┬────────────────────────────────────┘
┌────────────────────────────▼────────────────────────────────────┐
│ 业务服务层 │
│ Brief 解析服务 │ 脚本预审服务 │ 视频审核服务 │ 规则管理服务 │
└────────────────────────────┬────────────────────────────────────┘
┌────────────────────────────▼────────────────────────────────────┐
│ AI 能力层 │
│ 多模态 LLM │ ASR 引擎 │ OCR 引擎 │ CV 检测 │ 向量检索 │
└────────────────────────────┬────────────────────────────────────┘
┌────────────────────────────▼────────────────────────────────────┐
│ 数据与存储层 │
│ 对象存储 (视频/图片) │ 关系数据库 │ 向量数据库 │ 消息队列 │
└─────────────────────────────────────────────────────────────────┘
```
**核心技术依赖:**
* **多模态大模型:** 用于语义理解、Brief 解析、舆情判断
* **ASR/OCR** 支持普通话及主流方言的语音识别,支持复杂背景字幕识别
* **计算机视觉:** Logo 检测、物体识别、场景分类
* **消息队列:** 异步处理视频审核任务,支持优先级调度
---
## 8. 非功能性需求 (Non-Functional Requirements)
* **可用性:** 月度可用性 ≥ 99.5%,支持灰度发布与快速回滚。
@ -147,6 +197,8 @@
* **安全:** 传输与存储加密;基于角色的权限控制;关键操作二次确认。
* **数据保留:** 默认保留原始视频/报告 30 天,可按品牌配置延长或缩短。
* **合规与隐私:** 支持数据脱敏与最小化访问;操作日志可审计且不可篡改。
* **个人信息保护:** 符合《个人信息保护法》及 GDPR 要求;用户数据可导出、可删除;明确告知数据用途。
* **数据本地化:** 国内客户数据存储于中国大陆境内服务器;跨境传输需用户明示同意并符合监管要求。
---
@ -173,7 +225,35 @@
### 10.2 开放问题 (Open Questions)
* **规则迭代频率:** 是否需要与平台建立订阅机制,规则更新 SLA 如何定义?
* **训练数据来源:** 标注成本、数据授权路径与敏感数据脱敏策略如何确定?
* **舆情判断边界:** “油腻/爹味”等主观标签需要谁来兜底决策?
* **多语言支持:** 海外投放或多语种内容是否纳入本期范围?
| 问题 | 详细描述 | 建议解决方向 | 决策责任人 |
| --- | --- | --- | --- |
| **规则迭代频率** | 平台规则变更频繁,如何确保及时同步? | 建立官方公告订阅 + 人工值班巡检SLA ≤ 1 工作日 | 运营负责人 |
| **训练数据来源** | 标注成本高、数据授权复杂、敏感数据脱敏 | 优先使用品牌方授权的历史审核数据,建立数据脱敏 Pipeline | 算法 + 法务 |
| **舆情判断边界** | "油腻/爹味"等主观标签由谁最终定义? | 建立"品牌方确认"机制,软性风控仅作提示,不作为强制拦截 | 产品经理 |
| **多语言支持** | 海外投放需支持英语、日语等 | 本期仅支持中文(普通话 + 主流方言),多语言作为 V2 规划 | 产品经理 |
| **模型幻觉风险** | LLM 可能产生不准确的审核结论 | 关键判断必须提供证据片段,人工复核覆盖高风险内容 | 算法团队 |
| **定价与商业模式** | 按视频条数、时长还是座席收费? | 待商业化团队确定,技术架构需支持多种计费维度 | 商业化负责人 |
---
## 11. 附录 (Appendix)
### 11.1 相关文档
* 技术设计文档 (TDD) - 待编写
* API 接口规范 - 待编写
* 数据字典 - 待编写
* 测试计划 - 待编写
### 11.2 缩略语
| 缩略语 | 全称 | 说明 |
| --- | --- | --- |
| ASR | Automatic Speech Recognition | 自动语音识别 |
| OCR | Optical Character Recognition | 光学字符识别 |
| CV | Computer Vision | 计算机视觉 |
| NLP | Natural Language Processing | 自然语言处理 |
| LLM | Large Language Model | 大语言模型 |
| NPS | Net Promoter Score | 净推荐值 |
| SLA | Service Level Agreement | 服务级别协议 |
| GDPR | General Data Protection Regulation | 通用数据保护条例(欧盟) |