videos1.0/RequirementsDoc.md
2026-01-30 21:59:29 +08:00

179 lines
12 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# RequirementsDoc.md - 智能视频合规审核系统
| 文档类型 | **RD (Requirements Document)** |
| --- | --- |
| **项目名称** | SmartAudit (AI 营销内容合规审核平台) |
| **版本号** | V1.0 |
| **发布日期** | 2026-01-30 |
| **状态** | **修订 (Revised)** |
| **侧重** | 商业背景、用户价值、用户故事、成功指标 |
---
## 1. 业务背景与市场机会 (Business Context)
### 1.1 市场现状
随着短视频营销TikTok, 小红书, B站成为品牌投放的主流阵地品牌方每年需要审核数千甚至数万条达人视频。目前的审核流程存在严重瓶颈
1. **效率低下:** 人工审核一条 3 分钟视频+对比 Brief 平均耗时 15-20 分钟,且需反复修改 3-5 轮。
2. **标准不一:** 不同审核员对“品牌调性”理解不同,导致达人无所适从。
3. **风险高企:** 人工疲劳导致漏判(如竞品露出、边缘违禁词),极易引发公关危机。
### 1.2 核心痛点
* **对于品牌方:** 害怕由于达人“口无遮拦”或“价值观不当”导致品牌翻车。
* **对于代理商:** 深陷于“传话筒”困境大量人力浪费在检查错别字、Brief 对齐等低价值工作上。
* **对于达人:** 痛恨模糊的反馈(如“感觉不对”),希望获得即时、明确的修改指令,以便尽快结算。
### 1.3 产品愿景
打造一款**基于多模态大模型的 B2B SaaS 审核工具**。它不是要取代人工,而是作为**“智能预审员”**,在人工介入前自动化拦截 80% 的基础错误和合规风险,将审核流转周期从“天”缩短到“小时”。
---
## 2. 术语与定义 (Glossary)
* **Brief** 品牌投放要求文件,包含卖点、禁忌、话术、素材规范等。
* **违禁词库:** 平台与法律合规要求的规则集合(含极限词、功效词、敏感话题等)。
* **初审通过率:** 仅经过 AI 预审后一次性通过的比例(不进入人工返工)。
* **召回率/误报率:** 在标注测试集中,系统识别到“确实违规”的比例 / 误判为违规的比例。
* **Brand Safety** 涉及价值观、偏见、歧视、舆情争议等非硬性违规风险。
* **版本比对 (Diff)** 针对同一任务的不同版本视频,自动识别修改点和未修改点的能力。
---
## 3. 用户角色 (Personas)
| 角色 | 描述 | 核心动机 (Motivation) | 典型行为 |
| --- | --- | --- | --- |
| **品牌方 MKT (Brand)** | 甲方市场部负责人,对内容安全负最终责任。 | **安全第一**。宁可错杀,不可放过;维护品牌高端形象。 | 下达 Brief抽查最终视频处理严重争议。 |
| **代理商媒介 (Agency)** | 连接品牌与达人的中间方,系统的高频使用者。 | **效率至上**。希望快速过审,减少沟通成本,同时管理上百个达人。 | 上传 Brief初审达人作业进行仲裁。 |
| **达人/KOL (Creator)** | 内容创作者,系统的被审核端。 | **通过率与结算**。希望反馈明确,不要反复折腾。 | 上传脚本/视频,查看报错,申诉,修改。 |
---
## 4. 用户故事 (User Stories)
我们将需求拆解为具体的场景故事,以确保功能设计满足真实业务流。
### 4.1 场景一:任务启动与规则定义
* **[US-01]** 作为 **代理商**,我希望能够直接上传各种格式的原始 BriefPDF扫描件、Excel分镜表、Word文档**以及已授权的在线文档链接(如飞书/Notion分享链接**,让系统自动提取出“核心卖点”和“禁忌词”,无需手动录入。
* **[US-02]** 作为 **品牌方**,我希望系统能自动根据投放平台(如抖音、小红书)加载最新的平台违禁词库,确保 Brief 的要求不违反平台底线。
### 4.2 场景二:脚本预审 (Pre-production)
* **[US-03]** 作为 **达人**,我希望在拍摄前先提交文字脚本进行预审,让系统帮我检查是否遗漏了卖点或触犯了广告法,避免拍完重拍的巨大沉没成本。
* **[US-04]** 作为 **达人**,我希望审核系统能“读懂上下文”,不要因为我在讲故事时说了“最开心的一天”就报“广告极限词违规”,减少对创作的干扰。
### 4.3 场景三:视频智能审核 (Post-production)
* **[US-05]** 作为 **代理商**我希望系统能自动检测视频画面中是否出现了“竞品Logo”或“不雅背景”并精确到秒数标出来因为人工肉眼看视频很容易走神漏掉。
* **[US-06]** 作为 **品牌方**我希望系统具备“舆情敏感度”能提示达人视频中是否存在“油腻”、“爹味说教”或“性别偏见”的内容帮助我规避潜在的公关风险Brand Safety
* **[US-07]** 作为 **达人**,我希望在视频上传后的等待期间能看到 AI 的处理进度(如“正在核对口播...”),并在审核完成后收到一份带时间戳的修改清单。
### 4.4 场景四:人工复核与决策
* **[US-08]** 作为 **代理商审核员**,我希望在审核台看到 AI 已经标记好的风险点(红/黄/绿),我只需要点击确认或驳回,而不是从头把视频看一遍。
* **[US-09]** 作为 **品牌方**,我希望拥有“强制通过权”,当 AI 因为过于保守而报错(例如达人玩了一个很新的梗)时,我可以手动放行,并让系统记住这个特例。
### 4.5 场景五:规则运营与审计
* **[US-10]** 作为 **品牌方合规/法务**,我希望能配置“品牌私有规则”(如禁用词、竞品列表、白名单),并且对规则版本做可追溯的变更记录。
* **[US-11]** 作为 **代理商**,我希望支持批量上传与批量导出审核报告,便于一次处理多条达人任务。
* **[US-12]** 作为 **品牌方**,我希望在争议发生时能导出完整的审核证据链(时间戳、截图、规则依据、审核人)。
### 4.6 场景六:版本迭代与比对
* **[US-13]** 作为 **代理商**,当达人上传修改版视频 (V2) 时,我希望看到 **“新旧版本差异报告”**AI 明确告知“V1版本中指出的3个违规点有2个已修复1个未修复”从而极大缩短复审时间。
---
## 5. 成功指标 (Success Metrics / KPIs)
如果项目上线后达到以下指标,视为成功:
1. **审核效率提升 (Efficiency):** 单条视频人工投入时长从平均 **20 分钟** 降低至 **5 分钟**(以 30 天样本统计)。
2. **初审通过率 (Quality):** 经过 AI 脚本预审后,首次通过率提升 **≥ 30%**(对比上线前 30 天基线)。
3. **风险拦截率 (Recall):**
* **硬性合规 (Hard Rules):** 针对违禁词、竞品 Logo 等客观指标,召回率 **≥ 95%**,误报率 **≤ 5%**。
* **软性风控 (Soft Sentiment):** 针对舆情/价值观等主观指标,**一致性**(与人工复核结论一致)**≥ 80%**。
4. **用户满意度 (NPS):** 合作代理商的 NPS 提升 **≥ 10 分**。
---
## 6. 高层功能列表 (High-Level Features)
### ✅ In Scope (核心功能)
1. **全能文档解析引擎:** 支持 PDF/Word/Excel/PPT/图片/在线链接 的 Brief 自动解析与规则结构化。
2. **多模态审核核心:** 包含 NLP (文本/语义)、ASR (语音)、OCR (字幕)、CV (画面/物体) 综合检测能力。
3. **分区执法逻辑:** 智能区分“广告段”与“剧情段”,应用不同的审核尺度。
4. **舆情风控雷达:** 针对“油腻感”、“价值观风险”、“错别字”的专项检测模型。
5. **交互式审核台:** 支持时间戳打点、风险高亮、版本比对 (Diff) 的 Web 界面。
6. **信用与申诉体系:** 包含申诉令牌管理和人工仲裁流程。
7. **规则库管理与版本控制:** 支持平台规则库更新、品牌私有规则与白名单配置。
8. **权限与多租户隔离:** 支持品牌/代理/达人不同角色的权限与数据隔离。
9. **审计日志与报告导出:** 支持导出可追溯的审核证据链。
### ❌ Out of Scope (本期不做)
1. **视频剪辑工具:** 不提供在线剪辑功能,仅提供修改意见。
2. **支付与结算:** 不涉及品牌与达人的资金交易。
3. **发布后数据监测:** 不负责视频发布后的点赞/评论/转化数据分析。
4. **自动下架/投诉处理:** 不直接触发平台处罚或下架动作。
5. **直播流/实时切片审核:** 本期仅支持离线上传视频文件,不支持直播流的实时接入与毫秒级审核。
---
## 7. 假设与约束 (Assumptions & Constraints)
* **技术约束:** 视频处理极其消耗算力,需接受“非实时”反馈(深度审核需 1-3 分钟延迟)。
* **数据隐私:** 品牌方的 Brief 和私有数据必须严格隔离,不得用于训练通用模型。
* **平台依赖:** 若抖音/小红书的审核规则发生重大变更,系统需在一个工作日内更新规则库。
* **规则来源:** 具体合规规则由品牌/法务提供并确认,平台规则以官方公告为准。
* **在线文档接入:** 仅支持用户授权的分享链接;不得绕过权限或抓取受限内容。
* **区域合规:** 不同地区投放需切换对应法规与平台规则版本。
---
## 8. 非功能性需求 (Non-Functional Requirements)
* **可用性:** 月度可用性 ≥ 99.5%,支持灰度发布与快速回滚。
* **性能:** 1080p、≤ 100MB 视频生成报告 ≤ 5 分钟(排队时间不超过 2 分钟)。
* **安全:** 传输与存储加密;基于角色的权限控制;关键操作二次确认。
* **数据保留:** 默认保留原始视频/报告 30 天,可按品牌配置延长或缩短。
* **合规与隐私:** 支持数据脱敏与最小化访问;操作日志可审计且不可篡改。
---
## 9. 验收标准 (Acceptance Criteria)
* **Brief 解析:** 能够正确解析包含图文混排的 PDF Brief提取准确率 > 90%。
* **多模态检测:** 在标注测试集中,系统能识别画面角落里遮挡 30% 的竞品 LogoF1 ≥ 0.85。
* **语义理解:** 对广告极限词与非广告语境的区分误报率 ≤ 5%(样本量 ≥ 1,000 句)。
* **ASR/OCR:** 普通话 ASR 字错率 ≤ 10%,字幕 OCR 字准确率 ≥ 95%(含复杂背景)。
* **性能:** 100MB 以内的视频上传后AI 预审报告产出时间不超过 5 分钟。
* **审计链路:** 每条结论包含规则版本、模型版本、证据截图/片段与时间戳。
---
## 10. 风险与合规原则 (Risks & Compliance Principles)
### 10.1 系统合规性原则
* **规则来源合法:** 所有审核标准均需基于公开法律法规、平台官方规则或品牌方授权的私有 Brief不得未经授权抓取或绕过登录限制。
* **可解释与可申诉:** AI 不做黑盒决策,每条结论必须给出证据片段与规则依据,并支持申诉与人工仲裁。
* **数据授权与最小化:** 训练与评测数据需确保授权合规;默认最小化留存,过期自动清理。
* **辅助决策定位:** 系统明确定义为“辅助工具”,不直接触发下架、投诉或平台处罚动作,最终责任由人工操作员承担。
* **偏见与歧视控制:** 涉及主观评价的模型需经过偏见评估与定期复核,确保结论可解释且可追溯。
### 10.2 开放问题 (Open Questions)
* **规则迭代频率:** 是否需要与平台建立订阅机制,规则更新 SLA 如何定义?
* **训练数据来源:** 标注成本、数据授权路径与敏感数据脱敏策略如何确定?
* **舆情判断边界:** “油腻/爹味”等主观标签需要谁来兜底决策?
* **多语言支持:** 海外投放或多语种内容是否纳入本期范围?