- 新增 AIProviderConfig.md:详细设计 AI 厂商动态配置系统 - 数据库存储配置(而非环境变量) - 运行时动态加载,支持热更新 - 多租户隔离,支持品牌方独立配置 - API Key 加密存储 - 故障转移机制 - 更新 DevelopmentPlan.md (V1.4): - 在 AI 模型选型章节添加动态配置说明 - 添加 AIProviderConfig.md 到相关文档 - 更新 FeatureSummary.md (V1.3): - 新增系统管理模块 (F-47~F-50) - F-47: AI 厂商动态配置 (P0) - F-48: AI 厂商连通性测试 (P0) - F-49: 多租户 AI 配置隔离 (P1) - F-50: API Key 轮换管理 (P1) - 更新 RequirementsDoc.md 和 PRD.md: - 在技术架构概述中添加 AI 配置管理说明 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
403 lines
19 KiB
Markdown
403 lines
19 KiB
Markdown
# PRD.md - 智能视频合规审核系统
|
||
|
||
| 文档类型 | **PRD (Product Requirement Document)** |
|
||
| --- | --- |
|
||
| **项目名称** | SmartAudit (AI 营销内容合规审核平台) |
|
||
| **版本号** | V1.0 |
|
||
| **发布日期** | 2026-01-30 |
|
||
| **状态** | 草稿 (Draft) |
|
||
| **负责人** | 产品经理 |
|
||
|
||
---
|
||
|
||
## 版本历史 (Version History)
|
||
|
||
| 版本 | 日期 | 作者 | 变更说明 |
|
||
| --- | --- | --- | --- |
|
||
| V0.1 | 2026-01-30 | - | 基于 RequirementsDoc.md 产出首版 PRD |
|
||
| V0.2 | 2026-01-30 | ClaudeCode | 根据 RD 审阅修订:补充技术架构、术语定义、用户故事引用、品牌方工作流 |
|
||
| V0.3 | 2026-01-30 | Codex | 合规一致性修订:补充一致性定义、软性风控提示边界与特例记录规范 |
|
||
| V0.4 | 2026-01-30 | Claude | 审阅调整:补充产品愿景与量化目标、假设与约束章节、细化背景数据 |
|
||
| V1.0 | 2026-02-02 | Claude | 新增 AI 厂商动态配置架构引用 |
|
||
|
||
---
|
||
|
||
## 1. 背景与目标 (Background & Goals)
|
||
|
||
### 1.1 背景
|
||
|
||
品牌短视频投放已成主流,但当前人工审核存在严重瓶颈:
|
||
|
||
1. **效率低下:** 人工审核一条 3 分钟视频+对比 Brief 平均耗时 15-20 分钟,且需反复修改 3-5 轮
|
||
2. **标准不一:** 不同审核员对"品牌调性"理解不同,导致达人无所适从
|
||
3. **风险高企:** 人工疲劳导致漏判(如竞品露出、边缘违禁词),极易引发公关危机
|
||
|
||
### 1.2 产品愿景
|
||
|
||
打造一款**基于多模态大模型的 B2B SaaS 审核工具**。系统定位为**"智能预审员"**,在人工介入前**自动化拦截 80% 的基础错误和合规风险**,将审核流转周期从"天"缩短到"小时"。
|
||
|
||
### 1.3 目标
|
||
|
||
- 建立可复用的多模态审核能力,实现文本、语音、画面一致审核
|
||
- 在保持合规的前提下,将审核周期从天级缩短至小时级
|
||
- 形成可审计、可申诉、可追溯的审核证据链
|
||
|
||
### 1.4 非目标 (Non-Goals)
|
||
|
||
- 不提供视频剪辑或制作工具。
|
||
- 不涉及支付与结算。
|
||
- 不负责发布后数据监测。
|
||
- 不支持直播流实时审核。
|
||
- 不自动触发平台处罚或下架动作。
|
||
|
||
---
|
||
|
||
## 2. 术语与定义 (Glossary)
|
||
|
||
| 术语 | 定义 |
|
||
| --- | --- |
|
||
| Brief | 品牌投放要求文件,包含卖点、禁忌、话术、素材规范等 |
|
||
| 违禁词库 | 平台与法律合规要求的规则集合(含极限词、功效词、敏感话题等) |
|
||
| 初审通过率 | 仅经过 AI 预审后一次性通过的比例(不进入人工返工) |
|
||
| 召回率/误报率 | 在标注测试集中识别到"确实违规"的比例 / 误判为违规的比例 |
|
||
| Brand Safety | 涉及价值观、偏见、歧视、舆情争议等非硬性违规风险 |
|
||
| 一致性 | 软性风控结论与人工复核结论一致的比例(以人工复核为基准) |
|
||
| 版本比对 (Diff) | 针对同一任务的不同版本视频,自动识别修改点和未修改点的能力 |
|
||
|
||
---
|
||
|
||
## 3. 成功指标 (Success Metrics)
|
||
|
||
| 指标类别 | 指标名称 | 目标值 | 测量方式 | 责任方 |
|
||
| --- | --- | --- | --- | --- |
|
||
| 效率 | 单条视频人工投入时长 | 从 20 分钟降至 ≤ 5 分钟 | 系统埋点统计(30 天样本) | 产品经理 |
|
||
| 质量 | AI 脚本预审后首次通过率 | 提升 ≥ 30% | 对比上线前 30 天基线 | 算法团队 |
|
||
| 硬性召回 | 违禁词/竞品 Logo 召回率 | ≥ 95% | 标注测试集评估 | 算法团队 |
|
||
| 硬性误报 | 违禁词/竞品 Logo 误报率 | ≤ 5% | 标注测试集评估 | 算法团队 |
|
||
| 软性一致性 | 舆情/价值观判断一致性 | ≥ 80% | 人工复核抽样比对 | 运营团队 |
|
||
| 用户满意度 | 代理商 NPS | 提升 ≥ 10 分 | 季度问卷调研 | 客户成功 |
|
||
|
||
**基线数据采集计划:** 上线前 30 天内完成现有流程的数据埋点,建立各项指标的基线值。
|
||
|
||
---
|
||
|
||
## 4. 目标用户与核心场景 (Personas & Key Scenarios)
|
||
|
||
### 4.1 用户角色
|
||
|
||
| 角色 | 描述 | 核心动机 | 典型行为 |
|
||
| --- | --- | --- | --- |
|
||
| **品牌方 MKT (Brand)** | 甲方市场部负责人,对内容安全负最终责任 | **安全第一**:宁可错杀,不可放过 | 下达 Brief,抽查视频,处理争议 |
|
||
| **代理商媒介 (Agency)** | 连接品牌与达人的中间方,系统高频使用者 | **效率至上**:快速过审,减少沟通成本 | 上传 Brief,初审任务,仲裁 |
|
||
| **达人/KOL (Creator)** | 内容创作者,系统的被审核端 | **通过率与结算**:希望反馈明确 | 上传脚本/视频,查看报告,申诉 |
|
||
|
||
### 4.2 核心场景与优先级
|
||
|
||
> 引用 RequirementsDoc.md 用户故事编号
|
||
|
||
**P0(MVP 必须实现)**
|
||
- Brief 上传解析与规则提取 → [US-01]
|
||
- 平台规则库加载 → [US-02]
|
||
- 脚本预审 → [US-03]
|
||
- 视频自动审核(竞品、违禁词、画面风险) → [US-05]
|
||
- 审核台风险打点与确认/驳回 → [US-08]
|
||
|
||
**P1(首版发布后快速迭代)**
|
||
- 语境理解降低误报 → [US-04]
|
||
- Brand Safety 软性风险提示 → [US-06]
|
||
- 审核进度展示与时间戳修改清单 → [US-07]
|
||
- 强制通过权与特例记录 → [US-09]
|
||
- 品牌私有规则管理与版本记录 → [US-10]
|
||
- 证据链导出 → [US-12]
|
||
|
||
**P2(中长期规划)**
|
||
- 批量上传/导出 → [US-11]
|
||
- 版本差异报告 → [US-13]
|
||
|
||
---
|
||
|
||
## 5. 产品范围 (Scope)
|
||
|
||
### 5.1 In Scope
|
||
|
||
- **全能文档解析引擎:** 支持 PDF/Word/Excel/PPT/图片/在线链接 的 Brief 自动解析与规则结构化
|
||
- **多模态审核核心:** 包含 NLP (文本/语义)、ASR (语音)、OCR (字幕)、CV (画面/物体) 综合检测能力
|
||
- **分区执法逻辑:** 智能区分"广告段"与"剧情段",应用不同审核尺度
|
||
- **舆情风控雷达:** 针对"油腻感"、"价值观风险"、"错别字"的专项检测
|
||
- **交互式审核台:** 支持时间戳打点、风险高亮、版本比对 (Diff) 的 Web 界面
|
||
- **信用与申诉体系:** 包含申诉令牌管理和人工仲裁流程
|
||
- **规则库管理与版本控制:** 支持平台规则库更新、品牌私有规则与白名单配置
|
||
- **权限与多租户隔离:** 支持品牌/代理/达人不同角色的权限与数据隔离
|
||
- **审计日志与报告导出:** 支持导出可追溯的审核证据链
|
||
|
||
### 5.2 Out of Scope
|
||
|
||
- 视频剪辑工具:不提供在线剪辑功能,仅提供修改意见
|
||
- 支付与结算:不涉及品牌与达人的资金交易
|
||
- 发布后数据监测:不负责视频发布后的点赞/评论/转化数据分析
|
||
- 自动下架/投诉处理:不直接触发平台处罚或下架动作
|
||
- 直播流/实时切片审核:本期仅支持离线上传视频文件
|
||
|
||
---
|
||
|
||
## 6. 功能需求 (Functional Requirements)
|
||
|
||
> 说明:以下以模块划分,标注优先级 (P0/P1/P2),并引用 RD 用户故事编号。
|
||
|
||
### 6.1 Brief 与规则管理 [US-01, US-02, US-10]
|
||
|
||
**P0**
|
||
- 支持 PDF/Word/Excel/PPT/图片上传与解析
|
||
- 支持已授权在线文档链接导入(如飞书/Notion分享链接)
|
||
- **重要约束**:仅支持用户授权的分享链接;不得绕过权限或抓取受限内容
|
||
- 自动提取核心卖点、禁忌词、品牌调性要求
|
||
- 平台规则库按投放平台(抖音、小红书、B站等)自动加载并校验冲突
|
||
- **区域合规支持**:不同地区投放需切换对应法规与平台规则版本
|
||
|
||
**P1**
|
||
- 品牌私有规则管理(禁用词、白名单、竞品列表)
|
||
- 规则版本管理与变更审计(可追溯的变更记录)
|
||
|
||
**验收要点**
|
||
- 图文混排 Brief 解析准确率 > 90%
|
||
- 规则冲突提示清晰可追溯
|
||
|
||
### 6.2 脚本预审 (Pre-production) [US-03, US-04]
|
||
|
||
**P0**
|
||
- 支持文本脚本提交与预审
|
||
- 输出违规项、遗漏卖点、建议修改
|
||
- 帮助达人在拍摄前发现问题,避免拍完重拍的沉没成本
|
||
|
||
**P1**
|
||
- 语境理解降低误报(区分广告语境与日常语境)
|
||
- 例如:不应将"最开心的一天"误判为广告极限词违规
|
||
|
||
**验收要点**
|
||
- 广告极限词与非广告语境的区分误报率 ≤ 5%(样本量 ≥ 1,000 句)
|
||
|
||
### 6.3 视频智能审核 (Post-production) [US-05, US-06, US-07]
|
||
|
||
**P0**
|
||
- 支持视频上传(≤ 100MB,1080p)
|
||
- ASR/OCR/CV 联合检测
|
||
- 检测竞品 Logo、不雅背景、违禁词口播
|
||
- 输出时间戳级别的风险点(精确到秒数)
|
||
|
||
**P1**
|
||
- Brand Safety 软性风险提示(油腻、爹味说教、性别偏见等)
|
||
- **仅提示不强制拦截**,需人工复核确认
|
||
- 广告段/剧情段分区审核规则
|
||
- **审核进度展示**:在等待期间显示 AI 处理进度(如"正在核对口播...")
|
||
- 审核完成后提供带时间戳的修改清单
|
||
|
||
**验收要点**
|
||
- 竞品 Logo F1 ≥ 0.85(含画面角落遮挡 30% 场景)
|
||
- ASR 字错率 ≤ 10%(普通话 + 主流方言)
|
||
- OCR 准确率 ≥ 95%(含复杂背景)
|
||
- 报告产出时间 ≤ 5 分钟
|
||
|
||
### 6.4 审核台与人工复核 [US-08, US-09]
|
||
|
||
**P0**
|
||
- 审核台展示风险列表(红/黄/绿分级)与时间戳
|
||
- 支持确认/驳回操作,无需从头看视频
|
||
|
||
**P1**
|
||
- 品牌方"强制通过权":可手动放行过于保守的误报(需记录原因与审批人)
|
||
- 支持将特例记录为规则白名单/豁免条款(需品牌方确认)
|
||
- 如需用于模型优化,必须确保数据授权与合规评估
|
||
- 可查看规则依据与证据片段
|
||
|
||
**验收要点**
|
||
- 每条结论包含规则版本、模型版本、证据截图/片段与时间戳
|
||
|
||
### 6.5 申诉与仲裁
|
||
|
||
**P1**
|
||
- 申诉令牌管理与工单流转
|
||
- 人工仲裁流程与记录
|
||
- 审计日志完整可追溯
|
||
|
||
### 6.6 版本差异与批量处理 [US-11, US-13]
|
||
|
||
**P2**
|
||
- **新旧版本差异报告**:AI 明确告知"V1版本中指出的N个违规点,有X个已修复,Y个未修复"
|
||
- 批量上传与批量导出审核报告
|
||
|
||
---
|
||
|
||
## 7. 关键流程 (Key User Flows)
|
||
|
||
### 7.1 品牌方工作流
|
||
|
||
1. 制定并下达 Brief 投放要求
|
||
2. 配置品牌私有规则(禁用词、竞品列表、白名单)
|
||
3. 抽查最终视频审核报告
|
||
4. 处理严重争议与风险决策
|
||
5. 行使"强制通过权"处理误报
|
||
6. 导出审核证据链用于合规归档
|
||
|
||
### 7.2 代理商工作流
|
||
|
||
1. 创建任务并上传 Brief
|
||
2. 系统解析 Brief 并生成规则集
|
||
3. 创建达人任务并发起脚本预审
|
||
4. 达人上传视频,系统自动审核
|
||
5. 审核员在审核台确认/驳回(基于红/黄/绿风险标记)
|
||
6. 进行人工仲裁(如有争议)
|
||
7. 导出报告与证据链
|
||
|
||
### 7.3 达人工作流
|
||
|
||
1. 上传脚本进行预审
|
||
2. 根据建议修改并提交视频
|
||
3. 查看 AI 审核进度(如"正在核对口播...")
|
||
4. 收到带时间戳的修改清单
|
||
5. 触发申诉或修改再提交
|
||
|
||
---
|
||
|
||
## 8. 权限与多租户 (Permissions)
|
||
|
||
| 角色 | 可见范围 | 关键权限 |
|
||
| --- | --- | --- |
|
||
| 品牌方 | 品牌内任务与规则 | 强制通过、规则管理、报告导出、私有规则配置 |
|
||
| 代理商 | 代理商管理范围 | 任务创建、审核确认/驳回、批量处理、人工仲裁 |
|
||
| 达人 | 自己的任务 | 上传脚本/视频、查看报告、申诉 |
|
||
|
||
---
|
||
|
||
## 9. 数据与审计 (Data & Audit)
|
||
|
||
### 9.1 核心对象
|
||
|
||
- **任务**:品牌、代理、达人、投放平台、版本号
|
||
- **Brief**:原始文件、解析结构化内容
|
||
- **规则集**:平台规则 + 品牌私有规则 + 白名单 + 规则版本记录
|
||
- **审核记录**:风险项、时间戳、证据片段、风险等级(红/黄/绿)
|
||
- **人工决策**:确认/驳回/强制通过 + 操作人 + 操作时间
|
||
- **申诉记录**:申诉原因、仲裁结论、令牌消耗
|
||
|
||
### 9.2 审计要求 [US-12]
|
||
|
||
- 全流程日志可追溯、不可篡改
|
||
- 导出报告包含规则版本、模型版本、证据截图/片段与时间戳
|
||
- 支持争议场景下完整审核证据链导出
|
||
|
||
---
|
||
|
||
## 10. 非功能性需求 (NFR)
|
||
|
||
- **可用性**:月度可用性 ≥ 99.5%,支持灰度发布与快速回滚
|
||
- **性能**:1080p、≤ 100MB 视频生成报告 ≤ 5 分钟(排队时间不超过 2 分钟)
|
||
- **安全**:传输与存储加密;基于角色的权限控制;关键操作二次确认
|
||
- **隐私**:数据最小化访问;默认保留原始视频/报告 30 天,可按品牌配置延长或缩短
|
||
- **合规**:符合《个人信息保护法》与 GDPR;支持数据导出/删除;明确告知数据用途
|
||
- **数据本地化**:国内客户数据存储于中国大陆境内服务器;跨境传输需用户明示同意并符合监管要求
|
||
- **操作日志**:可审计且不可篡改
|
||
|
||
---
|
||
|
||
## 11. 假设与约束 (Assumptions & Constraints)
|
||
|
||
- **技术约束:** 视频处理极其消耗算力,需接受"非实时"反馈(深度审核需 1-3 分钟延迟)
|
||
- **数据隐私:** 品牌方的 Brief 和私有数据必须严格隔离,不得用于训练通用模型
|
||
- **平台依赖:** 若抖音/小红书的审核规则发生重大变更,系统需在一个工作日内更新规则库
|
||
- **规则来源:** 具体合规规则由品牌/法务提供并确认,平台规则以官方公告为准
|
||
- **在线文档接入:** 仅支持用户授权的分享链接;不得绕过权限或抓取受限内容
|
||
- **区域合规:** 不同地区投放需切换对应法规与平台规则版本
|
||
|
||
---
|
||
|
||
## 12. 合规原则与风控 (Compliance)
|
||
|
||
- **规则来源合法**:所有审核标准均需基于公开法律法规、平台官方规则或品牌方授权的私有 Brief;不得未经授权抓取或绕过登录限制
|
||
- **可解释与可申诉**:AI 不做黑盒决策,每条结论必须给出证据片段与规则依据,并支持申诉与人工仲裁
|
||
- **数据授权与最小化**:训练与评测数据需确保授权合规;默认最小化留存,过期自动清理
|
||
- **辅助决策定位**:系统明确定义为"辅助工具",不直接触发下架、投诉或平台处罚动作,最终责任由人工操作员承担
|
||
- **偏见与歧视控制**:涉及主观评价的模型需经过偏见评估与定期复核,确保结论可解释且可追溯
|
||
- **软性风控边界**:主观风险仅作提示,不作为强制拦截依据
|
||
|
||
---
|
||
|
||
## 13. 技术架构概述 (Technical Architecture Overview)
|
||
|
||
> 详细架构见技术设计文档
|
||
|
||
```
|
||
┌─────────────────────────────────────────────────────────────────┐
|
||
│ 用户接入层 │
|
||
│ Web Dashboard │ API Gateway │ 飞书/企微机器人 │ SDK │
|
||
└────────────────────────────┬────────────────────────────────────┘
|
||
│
|
||
┌────────────────────────────▼────────────────────────────────────┐
|
||
│ 业务服务层 │
|
||
│ Brief 解析服务 │ 脚本预审服务 │ 视频审核服务 │ 规则管理服务 │
|
||
└────────────────────────────┬────────────────────────────────────┘
|
||
│
|
||
┌────────────────────────────▼────────────────────────────────────┐
|
||
│ AI 能力层 │
|
||
│ 多模态 LLM │ ASR 引擎 │ OCR 引擎 │ CV 检测 │ 向量检索 │
|
||
└────────────────────────────┬────────────────────────────────────┘
|
||
│
|
||
┌────────────────────────────▼────────────────────────────────────┐
|
||
│ 数据与存储层 │
|
||
│ 对象存储 (视频/图片) │ 关系数据库 │ 向量数据库 │ 消息队列 │
|
||
└─────────────────────────────────────────────────────────────────┘
|
||
```
|
||
|
||
**核心技术依赖:**
|
||
- **多模态大模型**:用于语义理解、Brief 解析、舆情判断
|
||
- **ASR/OCR**:支持普通话及主流方言的语音识别,支持复杂背景字幕识别
|
||
- **计算机视觉**:Logo 检测、物体识别、场景分类
|
||
- **消息队列**:异步处理视频审核任务,支持优先级调度
|
||
- **AI 厂商动态配置**:支持在数据库中配置多个 AI 厂商(DeepSeek/OpenAI/OneAPI 等),运行时动态加载,支持多租户隔离和故障转移(详见 AIProviderConfig.md)
|
||
|
||
---
|
||
|
||
## 14. 里程碑与发布计划 (Milestones)
|
||
|
||
- **MVP (P0)**:Brief 解析、规则加载、脚本预审、视频审核、审核台
|
||
- **V1.1 (P1)**:Brand Safety 提示、规则版本、证据链导出、强制通过权、审核进度展示
|
||
- **V2 (P2)**:批量处理、版本差异报告
|
||
|
||
---
|
||
|
||
## 15. 风险与开放问题 (Open Questions)
|
||
|
||
| 问题 | 详细描述 | 建议解决方向 | 决策责任人 |
|
||
| --- | --- | --- | --- |
|
||
| 规则迭代频率 | 平台规则变更频繁,如何确保及时同步? | 建立官方公告订阅 + 人工值班巡检,SLA ≤ 1 工作日 | 运营负责人 |
|
||
| 训练数据来源 | 标注成本高、数据授权复杂、敏感数据脱敏 | 优先使用品牌方授权的历史审核数据,建立数据脱敏 Pipeline | 算法 + 法务 |
|
||
| 舆情判断边界 | "油腻/爹味"等主观标签由谁最终定义? | 建立"品牌方确认"机制,软性风控仅作提示,不作为强制拦截 | 产品经理 |
|
||
| 多语言支持 | 海外投放需支持英语、日语等 | 本期仅支持中文(普通话 + 主流方言),多语言作为 V2 规划 | 产品经理 |
|
||
| 模型幻觉风险 | LLM 可能产生不准确的审核结论 | 关键判断必须提供证据片段,人工复核覆盖高风险内容 | 算法团队 |
|
||
| 定价与商业模式 | 按视频条数、时长还是座席收费? | 待商业化团队确定,技术架构需支持多种计费维度 | 商业化负责人 |
|
||
|
||
---
|
||
|
||
## 16. 相关文档 (References)
|
||
|
||
- RequirementsDoc.md - 业务需求文档
|
||
- **AIProviderConfig.md - AI 厂商动态配置架构设计**
|
||
- 技术设计文档 (TDD) - 待编写
|
||
- API 接口规范 - 待编写
|
||
- 数据字典 - 待编写
|
||
- 测试计划 - 待编写
|
||
|
||
---
|
||
|
||
## 17. 缩略语 (Abbreviations)
|
||
|
||
| 缩略语 | 全称 | 说明 |
|
||
| --- | --- | --- |
|
||
| ASR | Automatic Speech Recognition | 自动语音识别 |
|
||
| OCR | Optical Character Recognition | 光学字符识别 |
|
||
| CV | Computer Vision | 计算机视觉 |
|
||
| NLP | Natural Language Processing | 自然语言处理 |
|
||
| LLM | Large Language Model | 大语言模型 |
|
||
| NPS | Net Promoter Score | 净推荐值 |
|
||
| SLA | Service Level Agreement | 服务级别协议 |
|
||
| GDPR | General Data Protection Regulation | 通用数据保护条例(欧盟) |
|