video-compliance-ai/RequirementsDoc.md
Your Name d52509d630 docs: 完善 TDD 计划与项目名称统一
主要变更:
- 项目名称统一为"秒思智能审核平台"(替换 SmartAudit)
- 完善 TDD 实施评估与计划 (featuredoc/tdd_plan.md V2.0)
  - 新增项目现状诊断与可行性分析
  - 新增前后端测试策略与工具链配置模板
  - 新增 CI/CD 集成方案与 Codecov 配置说明
  - 标注所有待创建模板文件
- 新增 GitHub 配置脚本 (scripts/setup-github.sh)
  - 自动配置分支保护规则
  - 验证 GitHub CLI 登录状态
- 更新 TASK-005-C 包含分支保护与 Codecov 配置
- 同步更新 F-51/F-52 功能至所有相关文档
- UI 设计 Logo 统一为"秒思"

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-02-04 11:08:59 +08:00

266 lines
18 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# RequirementsDoc.md - 智能视频合规审核系统
| 文档类型 | **RD (Requirements Document)** |
| --- | --- |
| **项目名称** | 秒思智能审核平台 (AI 营销内容合规审核平台) |
| **版本号** | V1.0 |
| **发布日期** | 2026-02-03 |
| **状态** | **修订 (Revised)** |
| **侧重** | 商业背景、用户价值、用户故事、成功指标 |
---
## 版本历史 (Version History)
| 版本 | 日期 | 作者 | 变更说明 |
| --- | --- | --- | --- |
| V0.1 | 2026-01-30 | - | 初稿创建 |
| V0.2 | 2026-01-30 | Gemini | 修订用户故事、成功指标 |
| V0.3 | 2026-01-30 | Codex | 优化合规建议 |
| V1.0 | 2026-01-30 | Claude | 综合审核:增加优先级、技术架构、合规细化 |
---
## 1. 业务背景与市场机会 (Business Context)
### 1.1 市场现状
随着短视频营销TikTok, 小红书, B站成为品牌投放的主流阵地品牌方每年需要审核数千甚至数万条达人视频。目前的审核流程存在严重瓶颈
1. **效率低下:** 人工审核一条 3 分钟视频+对比 Brief 平均耗时 15-20 分钟,且需反复修改 3-5 轮。
2. **标准不一:** 不同审核员对“品牌调性”理解不同,导致达人无所适从。
3. **风险高企:** 人工疲劳导致漏判(如竞品露出、边缘违禁词),极易引发公关危机。
### 1.2 核心痛点
* **对于品牌方:** 害怕由于达人“口无遮拦”或“价值观不当”导致品牌翻车。
* **对于代理商:** 深陷于“传话筒”困境大量人力浪费在检查错别字、Brief 对齐等低价值工作上。
* **对于达人:** 痛恨模糊的反馈(如“感觉不对”),希望获得即时、明确的修改指令,以便尽快结算。
### 1.3 产品愿景
打造一款**基于多模态大模型的 B2B SaaS 审核工具**。它不是要取代人工,而是作为**“智能预审员”**,在人工介入前自动化拦截 80% 的基础错误和合规风险,将审核流转周期从“天”缩短到“小时”。
---
## 2. 术语与定义 (Glossary)
* **Brief** 品牌投放要求文件,包含卖点、禁忌、话术、素材规范等。
* **违禁词库:** 平台与法律合规要求的规则集合(含极限词、功效词、敏感话题等)。
* **初审通过率:** 仅经过 AI 预审后一次性通过的比例(不进入人工返工)。
* **召回率/误报率:** 在标注测试集中,系统识别到“确实违规”的比例 / 误判为违规的比例。
* **Brand Safety** 涉及价值观、偏见、歧视、舆情争议等非硬性违规风险。
* **一致性:** 软性风控结论与人工复核结论一致的比例(以人工复核为基准)。
* **版本比对 (Diff)** 针对同一任务的不同版本视频,自动识别修改点和未修改点的能力。
---
## 3. 用户角色 (Personas)
| 角色 | 描述 | 核心动机 (Motivation) | 典型行为 |
| --- | --- | --- | --- |
| **品牌方 MKT (Brand)** | 甲方市场部负责人,对内容安全负最终责任。 | **安全第一**。宁可错杀,不可放过;维护品牌高端形象。 | 下达 Brief抽查最终视频处理严重争议。 |
| **代理商媒介 (Agency)** | 连接品牌与达人的中间方,系统的高频使用者。 | **效率至上**。希望快速过审,减少沟通成本,同时管理上百个达人。 | 上传 Brief初审达人作业进行仲裁。 |
| **达人/KOL (Creator)** | 内容创作者,系统的被审核端。 | **通过率与结算**。希望反馈明确,不要反复折腾。 | 上传脚本/视频,查看报错,申诉,修改。 |
---
## 4. 用户故事 (User Stories)
我们将需求拆解为具体的场景故事,以确保功能设计满足真实业务流。
### 4.1 场景一:任务启动与规则定义
* **[US-01] [P0]** 作为 **代理商**,我希望能够直接上传各种格式的原始 BriefPDF扫描件、Excel分镜表、Word文档**以及已授权的在线文档链接(如飞书/Notion分享链接**,让系统自动提取出"核心卖点"和"禁忌词",无需手动录入。
* **[US-02] [P0]** 作为 **品牌方**,我希望系统能自动根据投放平台(如抖音、小红书)加载最新的平台违禁词库,确保 Brief 的要求不违反平台底线。
### 4.2 场景二:脚本预审 (Pre-production)
* **[US-03] [P0]** 作为 **达人**,我希望在拍摄前先提交文字脚本进行预审,让系统帮我检查是否遗漏了卖点或触犯了广告法,避免拍完重拍的巨大沉没成本。
* **[US-04] [P0]** 作为 **达人**,我希望审核系统能"读懂上下文",不要因为我在讲故事时说了"最开心的一天"就报"广告极限词违规",减少对创作的干扰。
### 4.3 场景三:视频智能审核 (Post-production)
* **[US-05] [P0]** 作为 **代理商**,我希望系统能自动检测视频画面中是否出现了"竞品Logo"或"不雅背景",并精确到秒数标出来,因为人工肉眼看视频很容易走神漏掉。
* **[US-06] [P1]** 作为 **品牌方**,我希望系统具备"舆情敏感度",能提示达人视频中是否存在"油腻"、"爹味说教"或"性别偏见"的内容帮助我规避潜在的公关风险Brand Safety
* **[US-07] [P0]** 作为 **达人**,我希望在视频上传后的等待期间能看到 AI 的处理进度(如"正在核对口播..."),并在审核完成后收到一份带时间戳的修改清单。
### 4.4 场景四:人工复核与决策
* **[US-08] [P0]** 作为 **代理商审核员**,我希望在审核台看到 AI 已经标记好的风险点(红/黄/绿),我只需要点击确认或驳回,而不是从头把视频看一遍。
* **[US-09] [P1]** 作为 **品牌方**,我希望拥有"强制通过权",当 AI 因为过于保守而报错(例如达人玩了一个很新的梗)时,我可以手动放行,并让系统记住这个特例。
### 4.5 场景五:规则运营与审计
* **[US-10A] [P0]** 作为 **品牌方合规/法务**,我希望能配置"品牌私有规则"的基础部分(禁用词、竞品列表、白名单),确保最低合规要求可落地。
* **[US-10B] [P1]** 作为 **品牌方合规/法务**,我希望能配置高级豁免规则与舆情阈值,并对规则版本做可追溯的变更记录。
* **[US-11] [P2]** 作为 **代理商**,我希望支持**多文件拖拽并发上传 + Tus 断点续传**的批量上传,并可批量导出审核报告,便于一次处理多条达人任务(弃用 ZIP 方案)。
* **[US-12] [P1]** 作为 **品牌方**,我希望在争议发生时能导出完整的审核证据链(时间戳、截图、规则依据、审核人)。
### 4.6 场景六:版本迭代与比对
* **[US-13] [P2]** 作为 **代理商**,当达人上传修改版视频 (V2) 时,我希望看到 **"新旧版本差异报告"**AI 明确告知"V1版本中指出的3个违规点有2个已修复1个未修复",从而极大缩短复审时间。
> **优先级说明:** P0 = MVP必须实现P1 = 首版发布后快速迭代P2 = 中长期规划
---
## 5. 成功指标 (Success Metrics / KPIs)
如果项目上线后达到以下指标,视为成功:
| 指标类别 | 指标名称 | 目标值 | 测量方式 | 责任方 |
| --- | --- | --- | --- | --- |
| **效率 (Efficiency)** | 单条视频人工投入时长 | 从 20 分钟降至 **≤ 5 分钟** | 系统埋点统计30 天样本) | 产品经理 |
| **质量 (Quality)** | AI 脚本预审后首次通过率 | 提升 **≥ 30%** | 对比上线前 30 天基线 | 算法团队 |
| **硬性召回 (Hard Rules)** | 违禁词/竞品 Logo 召回率 | **≥ 95%** | 标注测试集评估 | 算法团队 |
| **硬性误报 (Hard Rules)** | 违禁词/竞品 Logo 误报率 | **≤ 5%** | 标注测试集评估 | 算法团队 |
| **软性一致性 (Soft Sentiment)** | 舆情/价值观判断一致性 | **≥ 80%** | 人工复核抽样比对 | 运营团队 |
| **用户满意度 (NPS)** | 代理商 NPS | 提升 **≥ 10 分** | 季度问卷调研 | 客户成功 |
**基线数据采集计划:** 上线前 30 天内完成现有流程的数据埋点,建立各项指标的基线值。
---
## 6. 高层功能列表 (High-Level Features)
### ✅ In Scope (核心功能)
1. **全能文档解析引擎:** 支持 PDF/Word/Excel/PPT/图片/在线链接 的 Brief 自动解析与规则结构化。
2. **多模态审核核心:** 包含 NLP (文本/语义)、ASR (语音)、OCR (字幕)、CV (画面/物体) 综合检测能力。
3. **分区执法逻辑:** 智能区分“广告段”与“剧情段”,应用不同的审核尺度。
4. **舆情风控雷达:** 针对“油腻感”、“价值观风险”、“错别字”的专项检测模型。
5. **交互式审核台:** 支持时间戳打点、风险高亮、版本比对 (Diff) 的 Web 界面。
6. **信用与申诉体系:** 包含申诉令牌管理和人工仲裁流程。
7. **规则库管理与版本控制:** 支持平台规则库更新、品牌私有规则与白名单配置。
8. **权限与多租户隔离:** 支持品牌/代理/达人不同角色的权限与数据隔离。
9. **审计日志与报告导出:** 支持导出可追溯的审核证据链。
10. **数据看板与核心指标:** 提供核心指标卡片与基础数据概览。
### ❌ Out of Scope (本期不做)
1. **视频剪辑工具:** 不提供在线剪辑功能,仅提供修改意见。
2. **支付与结算:** 不涉及品牌与达人的资金交易。
3. **发布后数据监测:** 不负责视频发布后的点赞/评论/转化数据分析。
4. **自动下架/投诉处理:** 不直接触发平台处罚或下架动作。
5. **直播流/实时切片审核:** 本期仅支持离线上传视频文件,不支持直播流的实时接入与毫秒级审核。
---
## 7. 假设与约束 (Assumptions & Constraints)
* **技术约束:** 视频处理极其消耗算力,需接受“非实时”反馈(深度审核需 3-5 分钟延迟)。
* **数据隐私:** 品牌方的 Brief 和私有数据必须严格隔离,不得用于训练通用模型。
* **平台依赖:** 若抖音/小红书的审核规则发生重大变更,系统需在一个工作日内更新规则库。
* **规则来源:** 具体合规规则由品牌/法务提供并确认,平台规则以官方公告为准。
* **在线文档接入:** 仅支持用户授权的分享链接;不得绕过权限或抓取受限内容。
* **区域合规:** 不同地区投放需切换对应法规与平台规则版本。
---
## 7.1 技术架构概述 (Technical Architecture Overview)
本节仅为高层技术选型参考,详细架构见技术设计文档。
```
┌─────────────────────────────────────────────────────────────────┐
│ 用户接入层 │
│ Web Dashboard │ API Gateway │ 飞书/企微机器人 │ SDK │
└────────────────────────────┬────────────────────────────────────┘
┌────────────────────────────▼────────────────────────────────────┐
│ 业务服务层 │
│ Brief 解析服务 │ 脚本预审服务 │ 视频审核服务 │ 规则管理服务 │
└────────────────────────────┬────────────────────────────────────┘
┌────────────────────────────▼────────────────────────────────────┐
│ AI 能力层 │
│ 多模态 LLM │ ASR 引擎 │ OCR 引擎 │ CV 检测 │ 向量检索 │
└────────────────────────────┬────────────────────────────────────┘
┌────────────────────────────▼────────────────────────────────────┐
│ 数据与存储层 │
│ 对象存储 (视频/图片) │ 关系数据库 │ 向量数据库 │ 消息队列 │
└─────────────────────────────────────────────────────────────────┘
```
**核心技术依赖:**
* **多模态大模型:** 用于语义理解、Brief 解析、舆情判断
* **ASR/OCR** 支持普通话及主流方言的语音识别,支持复杂背景字幕识别
* **计算机视觉:** Logo 检测、物体识别、场景分类
* **消息队列:** 异步处理视频审核任务,支持优先级调度
* **AI 厂商动态配置:** 支持在数据库中配置**单一 AI 提供商**(可为 OneAPI/OpenRouter 中转或直连厂商),运行时动态加载,支持多租户隔离;配置变更可随时切换(详见 AIProviderConfig.md
---
## 8. 非功能性需求 (Non-Functional Requirements)
* **可用性:** 月度可用性 ≥ 99.5%,支持灰度发布与快速回滚。
* **性能:** 1080p、≤ 100MB 视频生成报告 ≤ 5 分钟(含排队 ≤ 2 分钟)。
* **安全:** 传输与存储采用 AES-256-GCM 加密;基于角色的权限控制;关键操作二次确认。
* **数据保留:** 默认保留原始视频/报告 30 天,可按品牌配置延长或缩短。
* **合规与隐私:** 支持数据脱敏与最小化访问;操作日志可审计且不可篡改。
* **个人信息保护:** 符合《个人信息保护法》及 GDPR 要求;用户数据可导出、可删除;明确告知数据用途。
* **数据本地化:** 国内客户数据存储于中国大陆境内服务器;跨境传输需用户明示同意并符合监管要求。
---
## 9. 验收标准 (Acceptance Criteria)
* **Brief 解析:** 能够正确解析包含图文混排的 PDF Brief提取准确率 > 90%。
* **多模态检测:** 在标注测试集中,系统能识别画面角落里遮挡 30% 的竞品 LogoF1 ≥ 0.85。
* **语义理解:** 对广告极限词与非广告语境的区分误报率 ≤ 5%(样本量 ≥ 1,000 句)。
* **ASR/OCR:** 普通话 ASR 字错率 ≤ 10%,字幕 OCR 字准确率 ≥ 95%(含复杂背景)。
* **性能:** ≤ 100MB 视频上传后AI 预审报告产出时间不超过 5 分钟(含排队 ≤ 2 分钟)。
* **审计链路:** 每条结论包含规则版本、模型版本、证据截图/片段与时间戳。
* **F-45 时长与频次统计:** 时长统计误差 ≤ 1秒频次统计准确率 ≥ 95%。
* **审计日志不可篡改:** 采用 append-only + hash chain前序哈希 + 当前内容)校验可追溯。
---
## 10. 风险与合规原则 (Risks & Compliance Principles)
### 10.1 系统合规性原则
* **规则来源合法:** 所有审核标准均需基于公开法律法规、平台官方规则或品牌方授权的私有 Brief不得未经授权抓取或绕过登录限制。
* **可解释与可申诉:** AI 不做黑盒决策,每条结论必须给出证据片段与规则依据,并支持申诉与人工仲裁。
* **数据授权与最小化:** 训练与评测数据需确保授权合规;默认最小化留存,过期自动清理。
* **辅助决策定位:** 系统明确定义为“辅助工具”,不直接触发下架、投诉或平台处罚动作,最终责任由人工操作员承担。
* **偏见与歧视控制:** 涉及主观评价的模型需经过偏见评估与定期复核,确保结论可解释且可追溯。
### 10.2 开放问题 (Open Questions)
| 问题 | 详细描述 | 建议解决方向 | 决策责任人 |
| --- | --- | --- | --- |
| **规则迭代频率** | 平台规则变更频繁,如何确保及时同步? | 建立官方公告订阅 + 人工值班巡检SLA ≤ 1 工作日 | 运营负责人 |
| **训练数据来源** | 标注成本高、数据授权复杂、敏感数据脱敏 | 优先使用品牌方授权的历史审核数据,建立数据脱敏 Pipeline | 算法 + 法务 |
| **舆情判断边界** | "油腻/爹味"等主观标签由谁最终定义? | 建立"品牌方确认"机制,软性风控仅作提示,不作为强制拦截 | 产品经理 |
| **多语言支持** | 海外投放需支持英语、日语等 | 本期仅支持中文(普通话 + 主流方言),多语言作为 V2 规划 | 产品经理 |
| **模型幻觉风险** | LLM 可能产生不准确的审核结论 | 关键判断必须提供证据片段,人工复核覆盖高风险内容 | 算法团队 |
| **定价与商业模式** | 按视频条数、时长还是座席收费? | 待商业化团队确定,技术架构需支持多种计费维度 | 商业化负责人 |
---
## 11. 附录 (Appendix)
### 11.1 相关文档
* 技术设计文档 (TDD) - 待编写
* **AIProviderConfig.md - AI 厂商动态配置架构设计**
* API 接口规范 - 待编写
* 数据字典 - 待编写
* 测试计划 - 待编写
### 11.2 缩略语
| 缩略语 | 全称 | 说明 |
| --- | --- | --- |
| ASR | Automatic Speech Recognition | 自动语音识别 |
| OCR | Optical Character Recognition | 光学字符识别 |
| CV | Computer Vision | 计算机视觉 |
| NLP | Natural Language Processing | 自然语言处理 |
| LLM | Large Language Model | 大语言模型 |
| NPS | Net Promoter Score | 净推荐值 |
| SLA | Service Level Agreement | 服务级别协议 |
| GDPR | General Data Protection Regulation | 通用数据保护条例(欧盟) |