- 增加版本历史追踪文档变更 - 为用户故事添加优先级标识(P0/P1/P2) - 成功指标表格化,增加测量方式和责任方 - 新增技术架构概述章节 - 完善非功能性需求:增加个人信息保护法和数据本地化要求 - 开放问题表格化,增加解决方向和决策责任人 - 新增附录:相关文档列表和缩略语表 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
260 lines
17 KiB
Markdown
260 lines
17 KiB
Markdown
# RequirementsDoc.md - 智能视频合规审核系统
|
||
|
||
| 文档类型 | **RD (Requirements Document)** |
|
||
| --- | --- |
|
||
| **项目名称** | SmartAudit (AI 营销内容合规审核平台) |
|
||
| **版本号** | V1.0 |
|
||
| **发布日期** | 2026-01-30 |
|
||
| **状态** | **修订 (Revised)** |
|
||
| **侧重** | 商业背景、用户价值、用户故事、成功指标 |
|
||
|
||
---
|
||
|
||
## 版本历史 (Version History)
|
||
|
||
| 版本 | 日期 | 作者 | 变更说明 |
|
||
| --- | --- | --- | --- |
|
||
| V0.1 | 2026-01-30 | - | 初稿创建 |
|
||
| V0.2 | 2026-01-30 | Gemini | 修订用户故事、成功指标 |
|
||
| V0.3 | 2026-01-30 | Codex | 优化合规建议 |
|
||
| V1.0 | 2026-01-30 | Claude | 综合审核:增加优先级、技术架构、合规细化 |
|
||
|
||
---
|
||
|
||
## 1. 业务背景与市场机会 (Business Context)
|
||
|
||
### 1.1 市场现状
|
||
|
||
随着短视频营销(TikTok, 小红书, B站)成为品牌投放的主流阵地,品牌方每年需要审核数千甚至数万条达人视频。目前的审核流程存在严重瓶颈:
|
||
|
||
1. **效率低下:** 人工审核一条 3 分钟视频+对比 Brief 平均耗时 15-20 分钟,且需反复修改 3-5 轮。
|
||
2. **标准不一:** 不同审核员对“品牌调性”理解不同,导致达人无所适从。
|
||
3. **风险高企:** 人工疲劳导致漏判(如竞品露出、边缘违禁词),极易引发公关危机。
|
||
|
||
### 1.2 核心痛点
|
||
|
||
* **对于品牌方:** 害怕由于达人“口无遮拦”或“价值观不当”导致品牌翻车。
|
||
* **对于代理商:** 深陷于“传话筒”困境,大量人力浪费在检查错别字、Brief 对齐等低价值工作上。
|
||
* **对于达人:** 痛恨模糊的反馈(如“感觉不对”),希望获得即时、明确的修改指令,以便尽快结算。
|
||
|
||
### 1.3 产品愿景
|
||
|
||
打造一款**基于多模态大模型的 B2B SaaS 审核工具**。它不是要取代人工,而是作为**“智能预审员”**,在人工介入前自动化拦截 80% 的基础错误和合规风险,将审核流转周期从“天”缩短到“小时”。
|
||
|
||
---
|
||
|
||
## 2. 术语与定义 (Glossary)
|
||
|
||
* **Brief:** 品牌投放要求文件,包含卖点、禁忌、话术、素材规范等。
|
||
* **违禁词库:** 平台与法律合规要求的规则集合(含极限词、功效词、敏感话题等)。
|
||
* **初审通过率:** 仅经过 AI 预审后一次性通过的比例(不进入人工返工)。
|
||
* **召回率/误报率:** 在标注测试集中,系统识别到“确实违规”的比例 / 误判为违规的比例。
|
||
* **Brand Safety:** 涉及价值观、偏见、歧视、舆情争议等非硬性违规风险。
|
||
* **一致性:** 软性风控结论与人工复核结论一致的比例(以人工复核为基准)。
|
||
* **版本比对 (Diff):** 针对同一任务的不同版本视频,自动识别修改点和未修改点的能力。
|
||
|
||
---
|
||
|
||
## 3. 用户角色 (Personas)
|
||
|
||
| 角色 | 描述 | 核心动机 (Motivation) | 典型行为 |
|
||
| --- | --- | --- | --- |
|
||
| **品牌方 MKT (Brand)** | 甲方市场部负责人,对内容安全负最终责任。 | **安全第一**。宁可错杀,不可放过;维护品牌高端形象。 | 下达 Brief,抽查最终视频,处理严重争议。 |
|
||
| **代理商媒介 (Agency)** | 连接品牌与达人的中间方,系统的高频使用者。 | **效率至上**。希望快速过审,减少沟通成本,同时管理上百个达人。 | 上传 Brief,初审达人作业,进行仲裁。 |
|
||
| **达人/KOL (Creator)** | 内容创作者,系统的被审核端。 | **通过率与结算**。希望反馈明确,不要反复折腾。 | 上传脚本/视频,查看报错,申诉,修改。 |
|
||
|
||
---
|
||
|
||
## 4. 用户故事 (User Stories)
|
||
|
||
我们将需求拆解为具体的场景故事,以确保功能设计满足真实业务流。
|
||
|
||
### 4.1 场景一:任务启动与规则定义
|
||
|
||
* **[US-01] [P0]** 作为 **代理商**,我希望能够直接上传各种格式的原始 Brief(PDF扫描件、Excel分镜表、Word文档)**以及已授权的在线文档链接(如飞书/Notion分享链接)**,让系统自动提取出"核心卖点"和"禁忌词",无需手动录入。
|
||
* **[US-02] [P0]** 作为 **品牌方**,我希望系统能自动根据投放平台(如抖音、小红书)加载最新的平台违禁词库,确保 Brief 的要求不违反平台底线。
|
||
|
||
### 4.2 场景二:脚本预审 (Pre-production)
|
||
|
||
* **[US-03] [P0]** 作为 **达人**,我希望在拍摄前先提交文字脚本进行预审,让系统帮我检查是否遗漏了卖点或触犯了广告法,避免拍完重拍的巨大沉没成本。
|
||
* **[US-04] [P1]** 作为 **达人**,我希望审核系统能"读懂上下文",不要因为我在讲故事时说了"最开心的一天"就报"广告极限词违规",减少对创作的干扰。
|
||
|
||
### 4.3 场景三:视频智能审核 (Post-production)
|
||
|
||
* **[US-05] [P0]** 作为 **代理商**,我希望系统能自动检测视频画面中是否出现了"竞品Logo"或"不雅背景",并精确到秒数标出来,因为人工肉眼看视频很容易走神漏掉。
|
||
* **[US-06] [P1]** 作为 **品牌方**,我希望系统具备"舆情敏感度",能提示达人视频中是否存在"油腻"、"爹味说教"或"性别偏见"的内容,帮助我规避潜在的公关风险(Brand Safety)。
|
||
* **[US-07] [P1]** 作为 **达人**,我希望在视频上传后的等待期间能看到 AI 的处理进度(如"正在核对口播..."),并在审核完成后收到一份带时间戳的修改清单。
|
||
|
||
### 4.4 场景四:人工复核与决策
|
||
|
||
* **[US-08] [P0]** 作为 **代理商审核员**,我希望在审核台看到 AI 已经标记好的风险点(红/黄/绿),我只需要点击确认或驳回,而不是从头把视频看一遍。
|
||
* **[US-09] [P1]** 作为 **品牌方**,我希望拥有"强制通过权",当 AI 因为过于保守而报错(例如达人玩了一个很新的梗)时,我可以手动放行,并让系统记住这个特例。
|
||
|
||
### 4.5 场景五:规则运营与审计
|
||
|
||
* **[US-10] [P1]** 作为 **品牌方合规/法务**,我希望能配置"品牌私有规则"(如禁用词、竞品列表、白名单),并且对规则版本做可追溯的变更记录。
|
||
* **[US-11] [P2]** 作为 **代理商**,我希望支持批量上传与批量导出审核报告,便于一次处理多条达人任务。
|
||
* **[US-12] [P1]** 作为 **品牌方**,我希望在争议发生时能导出完整的审核证据链(时间戳、截图、规则依据、审核人)。
|
||
|
||
### 4.6 场景六:版本迭代与比对
|
||
|
||
* **[US-13] [P2]** 作为 **代理商**,当达人上传修改版视频 (V2) 时,我希望看到 **"新旧版本差异报告"**,AI 明确告知"V1版本中指出的3个违规点,有2个已修复,1个未修复",从而极大缩短复审时间。
|
||
|
||
> **优先级说明:** P0 = MVP必须实现;P1 = 首版发布后快速迭代;P2 = 中长期规划
|
||
|
||
---
|
||
|
||
## 5. 成功指标 (Success Metrics / KPIs)
|
||
|
||
如果项目上线后达到以下指标,视为成功:
|
||
|
||
| 指标类别 | 指标名称 | 目标值 | 测量方式 | 责任方 |
|
||
| --- | --- | --- | --- | --- |
|
||
| **效率 (Efficiency)** | 单条视频人工投入时长 | 从 20 分钟降至 **≤ 5 分钟** | 系统埋点统计(30 天样本) | 产品经理 |
|
||
| **质量 (Quality)** | AI 脚本预审后首次通过率 | 提升 **≥ 30%** | 对比上线前 30 天基线 | 算法团队 |
|
||
| **硬性召回 (Hard Rules)** | 违禁词/竞品 Logo 召回率 | **≥ 95%** | 标注测试集评估 | 算法团队 |
|
||
| **硬性误报 (Hard Rules)** | 违禁词/竞品 Logo 误报率 | **≤ 5%** | 标注测试集评估 | 算法团队 |
|
||
| **软性一致性 (Soft Sentiment)** | 舆情/价值观判断一致性 | **≥ 80%** | 人工复核抽样比对 | 运营团队 |
|
||
| **用户满意度 (NPS)** | 代理商 NPS | 提升 **≥ 10 分** | 季度问卷调研 | 客户成功 |
|
||
|
||
**基线数据采集计划:** 上线前 30 天内完成现有流程的数据埋点,建立各项指标的基线值。
|
||
|
||
---
|
||
|
||
## 6. 高层功能列表 (High-Level Features)
|
||
|
||
### ✅ In Scope (核心功能)
|
||
|
||
1. **全能文档解析引擎:** 支持 PDF/Word/Excel/PPT/图片/在线链接 的 Brief 自动解析与规则结构化。
|
||
2. **多模态审核核心:** 包含 NLP (文本/语义)、ASR (语音)、OCR (字幕)、CV (画面/物体) 综合检测能力。
|
||
3. **分区执法逻辑:** 智能区分“广告段”与“剧情段”,应用不同的审核尺度。
|
||
4. **舆情风控雷达:** 针对“油腻感”、“价值观风险”、“错别字”的专项检测模型。
|
||
5. **交互式审核台:** 支持时间戳打点、风险高亮、版本比对 (Diff) 的 Web 界面。
|
||
6. **信用与申诉体系:** 包含申诉令牌管理和人工仲裁流程。
|
||
7. **规则库管理与版本控制:** 支持平台规则库更新、品牌私有规则与白名单配置。
|
||
8. **权限与多租户隔离:** 支持品牌/代理/达人不同角色的权限与数据隔离。
|
||
9. **审计日志与报告导出:** 支持导出可追溯的审核证据链。
|
||
|
||
### ❌ Out of Scope (本期不做)
|
||
|
||
1. **视频剪辑工具:** 不提供在线剪辑功能,仅提供修改意见。
|
||
2. **支付与结算:** 不涉及品牌与达人的资金交易。
|
||
3. **发布后数据监测:** 不负责视频发布后的点赞/评论/转化数据分析。
|
||
4. **自动下架/投诉处理:** 不直接触发平台处罚或下架动作。
|
||
5. **直播流/实时切片审核:** 本期仅支持离线上传视频文件,不支持直播流的实时接入与毫秒级审核。
|
||
|
||
---
|
||
|
||
## 7. 假设与约束 (Assumptions & Constraints)
|
||
|
||
* **技术约束:** 视频处理极其消耗算力,需接受“非实时”反馈(深度审核需 1-3 分钟延迟)。
|
||
* **数据隐私:** 品牌方的 Brief 和私有数据必须严格隔离,不得用于训练通用模型。
|
||
* **平台依赖:** 若抖音/小红书的审核规则发生重大变更,系统需在一个工作日内更新规则库。
|
||
* **规则来源:** 具体合规规则由品牌/法务提供并确认,平台规则以官方公告为准。
|
||
* **在线文档接入:** 仅支持用户授权的分享链接;不得绕过权限或抓取受限内容。
|
||
* **区域合规:** 不同地区投放需切换对应法规与平台规则版本。
|
||
|
||
---
|
||
|
||
## 7.1 技术架构概述 (Technical Architecture Overview)
|
||
|
||
本节仅为高层技术选型参考,详细架构见技术设计文档。
|
||
|
||
```
|
||
┌─────────────────────────────────────────────────────────────────┐
|
||
│ 用户接入层 │
|
||
│ Web Dashboard │ API Gateway │ 飞书/企微机器人 │ SDK │
|
||
└────────────────────────────┬────────────────────────────────────┘
|
||
│
|
||
┌────────────────────────────▼────────────────────────────────────┐
|
||
│ 业务服务层 │
|
||
│ Brief 解析服务 │ 脚本预审服务 │ 视频审核服务 │ 规则管理服务 │
|
||
└────────────────────────────┬────────────────────────────────────┘
|
||
│
|
||
┌────────────────────────────▼────────────────────────────────────┐
|
||
│ AI 能力层 │
|
||
│ 多模态 LLM │ ASR 引擎 │ OCR 引擎 │ CV 检测 │ 向量检索 │
|
||
└────────────────────────────┬────────────────────────────────────┘
|
||
│
|
||
┌────────────────────────────▼────────────────────────────────────┐
|
||
│ 数据与存储层 │
|
||
│ 对象存储 (视频/图片) │ 关系数据库 │ 向量数据库 │ 消息队列 │
|
||
└─────────────────────────────────────────────────────────────────┘
|
||
```
|
||
|
||
**核心技术依赖:**
|
||
* **多模态大模型:** 用于语义理解、Brief 解析、舆情判断
|
||
* **ASR/OCR:** 支持普通话及主流方言的语音识别,支持复杂背景字幕识别
|
||
* **计算机视觉:** Logo 检测、物体识别、场景分类
|
||
* **消息队列:** 异步处理视频审核任务,支持优先级调度
|
||
|
||
---
|
||
|
||
## 8. 非功能性需求 (Non-Functional Requirements)
|
||
|
||
* **可用性:** 月度可用性 ≥ 99.5%,支持灰度发布与快速回滚。
|
||
* **性能:** 1080p、≤ 100MB 视频生成报告 ≤ 5 分钟(排队时间不超过 2 分钟)。
|
||
* **安全:** 传输与存储加密;基于角色的权限控制;关键操作二次确认。
|
||
* **数据保留:** 默认保留原始视频/报告 30 天,可按品牌配置延长或缩短。
|
||
* **合规与隐私:** 支持数据脱敏与最小化访问;操作日志可审计且不可篡改。
|
||
* **个人信息保护:** 符合《个人信息保护法》及 GDPR 要求;用户数据可导出、可删除;明确告知数据用途。
|
||
* **数据本地化:** 国内客户数据存储于中国大陆境内服务器;跨境传输需用户明示同意并符合监管要求。
|
||
|
||
---
|
||
|
||
## 9. 验收标准 (Acceptance Criteria)
|
||
|
||
* **Brief 解析:** 能够正确解析包含图文混排的 PDF Brief,提取准确率 > 90%。
|
||
* **多模态检测:** 在标注测试集中,系统能识别画面角落里遮挡 30% 的竞品 Logo,F1 ≥ 0.85。
|
||
* **语义理解:** 对广告极限词与非广告语境的区分误报率 ≤ 5%(样本量 ≥ 1,000 句)。
|
||
* **ASR/OCR:** 普通话 ASR 字错率 ≤ 10%,字幕 OCR 字准确率 ≥ 95%(含复杂背景)。
|
||
* **性能:** 100MB 以内的视频上传后,AI 预审报告产出时间不超过 5 分钟。
|
||
* **审计链路:** 每条结论包含规则版本、模型版本、证据截图/片段与时间戳。
|
||
|
||
---
|
||
|
||
## 10. 风险与合规原则 (Risks & Compliance Principles)
|
||
|
||
### 10.1 系统合规性原则
|
||
|
||
* **规则来源合法:** 所有审核标准均需基于公开法律法规、平台官方规则或品牌方授权的私有 Brief;不得未经授权抓取或绕过登录限制。
|
||
* **可解释与可申诉:** AI 不做黑盒决策,每条结论必须给出证据片段与规则依据,并支持申诉与人工仲裁。
|
||
* **数据授权与最小化:** 训练与评测数据需确保授权合规;默认最小化留存,过期自动清理。
|
||
* **辅助决策定位:** 系统明确定义为“辅助工具”,不直接触发下架、投诉或平台处罚动作,最终责任由人工操作员承担。
|
||
* **偏见与歧视控制:** 涉及主观评价的模型需经过偏见评估与定期复核,确保结论可解释且可追溯。
|
||
|
||
### 10.2 开放问题 (Open Questions)
|
||
|
||
| 问题 | 详细描述 | 建议解决方向 | 决策责任人 |
|
||
| --- | --- | --- | --- |
|
||
| **规则迭代频率** | 平台规则变更频繁,如何确保及时同步? | 建立官方公告订阅 + 人工值班巡检,SLA ≤ 1 工作日 | 运营负责人 |
|
||
| **训练数据来源** | 标注成本高、数据授权复杂、敏感数据脱敏 | 优先使用品牌方授权的历史审核数据,建立数据脱敏 Pipeline | 算法 + 法务 |
|
||
| **舆情判断边界** | "油腻/爹味"等主观标签由谁最终定义? | 建立"品牌方确认"机制,软性风控仅作提示,不作为强制拦截 | 产品经理 |
|
||
| **多语言支持** | 海外投放需支持英语、日语等 | 本期仅支持中文(普通话 + 主流方言),多语言作为 V2 规划 | 产品经理 |
|
||
| **模型幻觉风险** | LLM 可能产生不准确的审核结论 | 关键判断必须提供证据片段,人工复核覆盖高风险内容 | 算法团队 |
|
||
| **定价与商业模式** | 按视频条数、时长还是座席收费? | 待商业化团队确定,技术架构需支持多种计费维度 | 商业化负责人 |
|
||
|
||
---
|
||
|
||
## 11. 附录 (Appendix)
|
||
|
||
### 11.1 相关文档
|
||
|
||
* 技术设计文档 (TDD) - 待编写
|
||
* API 接口规范 - 待编写
|
||
* 数据字典 - 待编写
|
||
* 测试计划 - 待编写
|
||
|
||
### 11.2 缩略语
|
||
|
||
| 缩略语 | 全称 | 说明 |
|
||
| --- | --- | --- |
|
||
| ASR | Automatic Speech Recognition | 自动语音识别 |
|
||
| OCR | Optical Character Recognition | 光学字符识别 |
|
||
| CV | Computer Vision | 计算机视觉 |
|
||
| NLP | Natural Language Processing | 自然语言处理 |
|
||
| LLM | Large Language Model | 大语言模型 |
|
||
| NPS | Net Promoter Score | 净推荐值 |
|
||
| SLA | Service Level Agreement | 服务级别协议 |
|
||
| GDPR | General Data Protection Regulation | 通用数据保护条例(欧盟) |
|