Your Name 2f2f7e0f61 docs: 完善文档体系与一致性修复

- 新增 AI 厂商动态配置架构文档 (AIProviderConfig V2.0)
- 新增 TDD 实施计划 (featuredoc/tdd_plan.md)
- 新增文档矛盾追踪记录 (DocumentContradictions.md)
- 统一所有文档的技术指标与优先级定义
- 完善功能清单 (F-47~F-50 AI 配置功能)
- 更新任务清单支持 AI 服务配置任务

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

2026-02-03 15:49:57 +08:00

21 KiB

Raw Blame History

PRD.md - 智能视频合规审核系统

文档类型	PRD (Product Requirement Document)
项目名称	SmartAudit (AI 营销内容合规审核平台)
版本号	V1.0
发布日期	2026-02-03
状态	草稿 (Draft)
负责人	产品经理

版本历史 (Version History)

版本	日期	作者	变更说明
V0.1	2026-01-30	-	基于 RequirementsDoc.md 产出首版 PRD
V0.2	2026-01-30	ClaudeCode	根据 RD 审阅修订：补充技术架构、术语定义、用户故事引用、品牌方工作流
V0.3	2026-01-30	Codex	合规一致性修订：补充一致性定义、软性风控提示边界与特例记录规范
V0.4	2026-01-30	Claude	审阅调整：补充产品愿景与量化目标、假设与约束章节、细化背景数据
V1.0	2026-02-02	Claude	新增 AI 厂商动态配置架构引用

1. 背景与目标 (Background & Goals)

1.1 背景

品牌短视频投放已成主流，但当前人工审核存在严重瓶颈：

效率低下： 人工审核一条 3 分钟视频+对比 Brief 平均耗时 15-20 分钟，且需反复修改 3-5 轮
标准不一： 不同审核员对"品牌调性"理解不同，导致达人无所适从
风险高企： 人工疲劳导致漏判（如竞品露出、边缘违禁词），极易引发公关危机

1.2 产品愿景

打造一款基于多模态大模型的 B2B SaaS 审核工具。系统定位为**"智能预审员"，在人工介入前自动化拦截 80% 的基础错误和合规风险**，将审核流转周期从"天"缩短到"小时"。

1.3 目标

建立可复用的多模态审核能力，实现文本、语音、画面一致审核
在保持合规的前提下，将审核周期从天级缩短至小时级
形成可审计、可申诉、可追溯的审核证据链

1.4 非目标 (Non-Goals)

不提供视频剪辑或制作工具。
不涉及支付与结算。
不负责发布后数据监测。
不支持直播流实时审核。
不自动触发平台处罚或下架动作。

2. 术语与定义 (Glossary)

术语	定义
Brief	品牌投放要求文件，包含卖点、禁忌、话术、素材规范等
违禁词库	平台与法律合规要求的规则集合（含极限词、功效词、敏感话题等）
初审通过率	仅经过 AI 预审后一次性通过的比例（不进入人工返工）
召回率/误报率	在标注测试集中识别到"确实违规"的比例 / 误判为违规的比例
Brand Safety	涉及价值观、偏见、歧视、舆情争议等非硬性违规风险
一致性	软性风控结论与人工复核结论一致的比例（以人工复核为基准）
版本比对 (Diff)	针对同一任务的不同版本视频，自动识别修改点和未修改点的能力

3. 成功指标 (Success Metrics)

指标类别	指标名称	目标值	测量方式	责任方
效率	单条视频人工投入时长	从 20 分钟降至 ≤ 5 分钟	系统埋点统计（30 天样本）	产品经理
质量	AI 脚本预审后首次通过率	提升 ≥ 30%	对比上线前 30 天基线	算法团队
硬性召回	违禁词/竞品 Logo 召回率	≥ 95%	标注测试集评估	算法团队
硬性误报	违禁词/竞品 Logo 误报率	≤ 5%	标注测试集评估	算法团队
软性一致性	舆情/价值观判断一致性	≥ 80%	人工复核抽样比对	运营团队
用户满意度	代理商 NPS	提升 ≥ 10 分	季度问卷调研	客户成功

基线数据采集计划： 上线前 30 天内完成现有流程的数据埋点，建立各项指标的基线值。

4. 目标用户与核心场景 (Personas & Key Scenarios)

4.1 用户角色

角色	描述	核心动机	典型行为
品牌方 MKT (Brand)	甲方市场部负责人，对内容安全负最终责任	安全第一：宁可错杀，不可放过	下达 Brief，抽查视频，处理争议
代理商媒介 (Agency)	连接品牌与达人的中间方，系统高频使用者	效率至上：快速过审，减少沟通成本	上传 Brief，初审任务，仲裁
达人/KOL (Creator)	内容创作者，系统的被审核端	通过率与结算：希望反馈明确	上传脚本/视频，查看报告，申诉

4.2 核心场景与优先级

引用 RequirementsDoc.md 用户故事编号

P0（MVP 必须实现）

Brief 上传解析与规则提取 → [US-01]
平台规则库加载 → [US-02]
脚本预审 → [US-03]
视频自动审核（竞品、违禁词、画面风险） → [US-05]
审核台风险打点与确认/驳回 → [US-08]
语境理解降低误报 → [US-04]
审核进度展示与时间戳修改清单 → [US-07]
基础黑白名单与竞品库（F-05-A） → [US-10A]
时长与频次校验（F-45） → [US-05]
AI 服务配置与连通性测试（F-47/F-48）
多租户 AI 配置隔离（F-49）

P1（首版发布后快速迭代）

Brand Safety 软性风险提示 → [US-06]
强制通过权与特例记录 → [US-09]
高级豁免规则（F-05-B）与版本记录 → [US-10B]
证据链导出 → [US-12]

P2（中长期规划）

批量上传/导出（多文件拖拽并发 + Tus 断点续传，弃用 ZIP） → [US-11]
版本差异报告 → [US-13]

5. 产品范围 (Scope)

5.1 In Scope

全能文档解析引擎： 支持 PDF/Word/Excel/PPT/图片/在线链接的 Brief 自动解析与规则结构化
多模态审核核心： 包含 NLP (文本/语义)、ASR (语音)、OCR (字幕)、CV (画面/物体) 综合检测能力
分区执法逻辑： 智能区分"广告段"与"剧情段"，应用不同审核尺度
舆情风控雷达： 针对"油腻感"、"价值观风险"、"错别字"的专项检测
交互式审核台： 支持时间戳打点、风险高亮、版本比对 (Diff) 的 Web 界面
移动端支持： 响应式 H5 覆盖达人/代理商/品牌方（可作为小程序 WebView 承载）
信用与申诉体系： 包含申诉令牌管理和人工仲裁流程
规则库管理与版本控制： 支持平台规则库更新、品牌私有规则与白名单配置
权限与多租户隔离： 支持品牌/代理/达人不同角色的权限与数据隔离
审计日志与报告导出： 支持导出可追溯的审核证据链

5.2 Out of Scope

视频剪辑工具：不提供在线剪辑功能，仅提供修改意见
支付与结算：不涉及品牌与达人的资金交易
发布后数据监测：不负责视频发布后的点赞/评论/转化数据分析
自动下架/投诉处理：不直接触发平台处罚或下架动作
直播流/实时切片审核：本期仅支持离线上传视频文件
原生 App：本期不做

6. 功能需求 (Functional Requirements)

说明：以下以模块划分，标注优先级 (P0/P1/P2)，并引用 RD 用户故事编号。

6.1 Brief 与规则管理 [US-01, US-02, US-10A, US-10B]

支持 PDF/Word/Excel/PPT/图片上传与解析
支持已授权在线文档链接导入（如飞书/Notion分享链接）
- 重要约束：仅支持用户授权的分享链接；不得绕过权限或抓取受限内容
自动提取核心卖点、禁忌词、品牌调性要求
平台规则库按投放平台（抖音、小红书、B站等）自动加载并校验冲突
区域合规支持：不同地区投放需切换对应法规与平台规则版本

基础黑白名单与竞品库（F-05-A）：品牌私有禁用词、白名单、竞品列表的基础管理

高级豁免规则（F-05-B）：品牌私有规则的高级豁免与例外配置
规则版本管理与变更审计（可追溯的变更记录）

验收要点

图文混排 Brief 解析准确率 > 90%
规则冲突提示清晰可追溯
平台规则变更 ≤ 1 工作日内同步

6.2 脚本预审 (Pre-production) [US-03, US-04]

支持文本脚本提交与预审
输出违规项、遗漏卖点、建议修改
帮助达人在拍摄前发现问题，避免拍完重拍的沉没成本

语境理解降低误报（区分广告语境与日常语境）
- 例如：不应将"最开心的一天"误判为广告极限词违规

验收要点

广告极限词与非广告语境的区分误报率 ≤ 5%（样本量 ≥ 1,000 句）

6.3 视频智能审核 (Post-production) [US-05, US-06, US-07]

支持视频上传（≤ 100MB，1080p）
ASR/OCR/CV 联合检测
检测竞品 Logo、不雅背景、违禁词口播
时长与频次校验： 根据 Brief 的时序要求校验产品同框时长与口播提及频次
输出时间戳级别的风险点（精确到秒数）

审核进度展示：在等待期间显示 AI 处理进度（如"正在核对口播..."）
时长与频次校验（F-45）：根据 Brief 要求校验产品同框时长、品牌提及频次等硬性指标

Brand Safety 软性风险提示（油腻、爹味说教、性别偏见等）
- 仅提示不强制拦截，需人工复核确认
广告段/剧情段分区审核规则
审核完成后提供带时间戳的修改清单

验收要点

竞品 Logo F1 ≥ 0.85（含画面角落遮挡 30% 场景）
ASR 字错率 ≤ 10%（普通话 + 主流方言）
OCR 准确率 ≥ 95%（含复杂背景）
时长统计误差 ≤ 1 秒；频次统计准确率 ≥ 95%
视频分析采样率默认 2fps，并在该采样率下验证时长统计准确性
报告产出时间 ≤ 5 分钟（含排队 ≤ 2 分钟）

6.4 审核台与人工复核 [US-08, US-09]

审核台展示风险列表（红/黄/绿分级）与时间戳
支持确认/驳回操作，无需从头看视频

品牌方"强制通过权"：可手动放行过于保守的误报（需记录原因与审批人）；默认授权代理商独立使用，可在品牌方设置中按代理商关闭，关闭后需走审批流程。强制通过弹窗需填写原因，并提供“保存为特例”可选项（默认不勾选，勾选后形成豁免条款，需品牌方确认生效）
特例可沉淀为规则白名单/豁免条款（含来源：强制通过勾选或手动记录）
- 如需用于模型优化，必须确保数据授权与合规评估
可查看规则依据与证据片段

验收要点

每条结论包含规则版本、模型版本、证据截图/片段与时间戳

6.5 代理商管理

代理商列表与绑定项目展示
可配置可见 Brief 范围、仲裁权限
强制通过授权开关（按代理商配置，默认开启，可关闭）
绩效评分卡（审核量、通过率、问题率、平均周期）

验收要点

权限配置可保存并即时生效
绩效指标口径与数据看板一致

6.6 申诉与仲裁

申诉令牌管理与工单流转
人工仲裁流程与记录
审计日志完整可追溯

6.7 版本差异与批量处理 [US-11, US-13]

新旧版本差异报告：AI 明确告知"V1版本中指出的N个违规点，有X个已修复，Y个未修复"
批量上传与批量导出审核报告（多文件拖拽并发 + Tus 断点续传，弃用 ZIP）

6.8 AI 服务配置与连通性测试

品牌方管理员可配置 AI 提供商、Base URL、API Key、默认模型（文本/视觉/音频）
API Key 使用 AES-256-GCM 加密存储
提供连通性测试（并行测试三类模型）
多租户隔离；代理商/达人自动继承品牌方配置
未配置时阻断调用并提示品牌方完成配置

验收要点

未配置时返回明确错误与引导
连通性测试结果明确展示成功/失败及错误原因
配置变更即时生效（无需重启）

7. 关键流程 (Key User Flows)

7.1 品牌方工作流

制定并下达 Brief 投放要求
配置品牌私有规则（禁用词、竞品列表、白名单）
抽查最终视频审核报告
处理严重争议与风险决策
行使"强制通过权"处理误报
导出审核证据链用于合规归档

7.2 代理商工作流

创建任务并上传 Brief
系统解析 Brief 并生成规则集
创建达人任务并发起脚本预审
达人上传视频，系统自动审核
审核员在审核台确认/驳回（基于红/黄/绿风险标记）
进行人工仲裁（如有争议）
导出报告与证据链

7.3 达人工作流

上传脚本进行预审
根据建议修改并提交视频
查看 AI 审核进度（如"正在核对口播..."）
收到带时间戳的修改清单
触发申诉或修改再提交

8. 权限与多租户 (Permissions)

角色	可见范围	关键权限
品牌方（含品牌方管理员）	品牌内任务与规则	强制通过、规则管理、报告导出、私有规则配置、AI 服务商配置与管理
代理商	代理商管理范围	任务创建、审核确认/驳回、批量处理、人工仲裁、强制通过（按代理商授权，默认开启，可关闭）
达人	自己的任务	上传脚本/视频、查看报告、申诉

9. 数据与审计 (Data & Audit)

9.1 核心对象

任务：品牌、代理、达人、投放平台、版本号
Brief：原始文件、解析结构化内容
规则集：平台规则 + 品牌私有规则 + 白名单 + 规则版本记录
审核记录：风险项、时间戳、证据片段、风险等级（红/黄/绿）
人工决策：确认/驳回/强制通过 + 操作人 + 操作时间
申诉记录：申诉原因、仲裁结论、令牌消耗

9.2 审计要求 [US-12]

全流程日志可追溯、不可篡改
导出报告包含规则版本、模型版本、证据截图/片段与时间戳
支持争议场景下完整审核证据链导出

10. 非功能性需求 (NFR)

可用性：月度可用性 ≥ 99.5%，支持灰度发布与快速回滚
性能：1080p、≤ 100MB 视频生成报告 ≤ 5 分钟（含排队 ≤ 2 分钟）
安全：传输与存储加密；基于角色的权限控制；关键操作二次确认
隐私：数据最小化访问；默认保留原始视频/报告 30 天，可按品牌配置延长或缩短
合规：符合《个人信息保护法》与 GDPR；支持数据导出/删除；明确告知数据用途
数据本地化：国内客户数据存储于中国大陆境内服务器；跨境传输需用户明示同意并符合监管要求
操作日志：可审计且不可篡改

11. 假设与约束 (Assumptions & Constraints)

技术约束： 视频处理极其消耗算力，需接受"非实时"反馈（深度审核需 3-5 分钟延迟）
数据隐私： 品牌方的 Brief 和私有数据必须严格隔离，不得用于训练通用模型
平台依赖： 若抖音/小红书的审核规则发生重大变更，系统需在一个工作日内更新规则库
规则来源： 具体合规规则由品牌/法务提供并确认，平台规则以官方公告为准
在线文档接入： 仅支持用户授权的分享链接；不得绕过权限或抓取受限内容
区域合规： 不同地区投放需切换对应法规与平台规则版本

12. 合规原则与风控 (Compliance)

规则来源合法：所有审核标准均需基于公开法律法规、平台官方规则或品牌方授权的私有 Brief；不得未经授权抓取或绕过登录限制
可解释与可申诉：AI 不做黑盒决策，每条结论必须给出证据片段与规则依据，并支持申诉与人工仲裁
数据授权与最小化：训练与评测数据需确保授权合规；默认最小化留存，过期自动清理
辅助决策定位：系统明确定义为"辅助工具"，不直接触发下架、投诉或平台处罚动作，最终责任由人工操作员承担
偏见与歧视控制：涉及主观评价的模型需经过偏见评估与定期复核，确保结论可解释且可追溯
软性风控边界：主观风险仅作提示，不作为强制拦截依据

13. 技术架构概述 (Technical Architecture Overview)

详细架构见技术设计文档

┌─────────────────────────────────────────────────────────────────┐
│                        用户接入层                                │
│   Web Dashboard │ API Gateway │ 飞书/企微机器人 │ SDK          │
└────────────────────────────┬────────────────────────────────────┘
                             │
┌────────────────────────────▼────────────────────────────────────┐
│                        业务服务层                                │
│  Brief 解析服务 │ 脚本预审服务 │ 视频审核服务 │ 规则管理服务     │
└────────────────────────────┬────────────────────────────────────┘
                             │
┌────────────────────────────▼────────────────────────────────────┐
│                        AI 能力层                                 │
│  多模态 LLM │ ASR 引擎 │ OCR 引擎 │ CV 检测 │ 向量检索          │
└────────────────────────────┬────────────────────────────────────┘
                             │
┌────────────────────────────▼────────────────────────────────────┐
│                        数据与存储层                              │
│  对象存储 (视频/图片) │ 关系数据库 │ 向量数据库 │ 消息队列       │
└─────────────────────────────────────────────────────────────────┘

核心技术依赖：

多模态大模型：用于语义理解、Brief 解析、舆情判断
ASR/OCR：支持普通话及主流方言的语音识别，支持复杂背景字幕识别
计算机视觉：Logo 检测、物体识别、场景分类
消息队列：异步处理视频审核任务，支持优先级调度
AI 厂商动态配置：品牌方管理员可在后台配置多个 AI 厂商（DeepSeek/OpenAI/OneAPI 等），运行时动态加载，支持多租户隔离和故障转移（详见 AIProviderConfig.md）

14. 里程碑与发布计划 (Milestones)

MVP (P0)：Brief 解析、规则加载、脚本预审、视频审核、审核台、语境理解降低误报、审核进度展示、基础黑白名单与竞品库、时长与频次校验、AI 服务商配置
V1.1 (P1)：Brand Safety 提示、规则版本、证据链导出、强制通过权、高级豁免规则
V2 (P2)：批量处理、版本差异报告

15. 风险与开放问题 (Open Questions)

问题	详细描述	建议解决方向	决策责任人
规则迭代频率	平台规则变更频繁，如何确保及时同步？	建立官方公告订阅 + 人工值班巡检，SLA ≤ 1 工作日	运营负责人
训练数据来源	标注成本高、数据授权复杂、敏感数据脱敏	优先使用品牌方授权的历史审核数据，建立数据脱敏 Pipeline	算法 + 法务
舆情判断边界	"油腻/爹味"等主观标签由谁最终定义？	建立"品牌方确认"机制，软性风控仅作提示，不作为强制拦截	产品经理
多语言支持	海外投放需支持英语、日语等	本期仅支持中文（普通话 + 主流方言），多语言作为 V2 规划	产品经理
模型幻觉风险	LLM 可能产生不准确的审核结论	关键判断必须提供证据片段，人工复核覆盖高风险内容	算法团队
定价与商业模式	按视频条数、时长还是座席收费？	待商业化团队确定，技术架构需支持多种计费维度	商业化负责人

16. 相关文档 (References)

RequirementsDoc.md - 业务需求文档
AIProviderConfig.md - AI 厂商动态配置架构设计
技术设计文档 (TDD) - 待编写
API 接口规范 - 待编写
数据字典 - 待编写
测试计划 - 待编写

17. 缩略语 (Abbreviations)

缩略语	全称	说明
ASR	Automatic Speech Recognition	自动语音识别
OCR	Optical Character Recognition	光学字符识别
CV	Computer Vision	计算机视觉
NLP	Natural Language Processing	自然语言处理
LLM	Large Language Model	大语言模型
NPS	Net Promoter Score	净推荐值
SLA	Service Level Agreement	服务级别协议
GDPR	General Data Protection Regulation	通用数据保护条例（欧盟）

21 KiB Raw Blame History Unescape Escape

PRD.md - 智能视频合规审核系统

版本历史 (Version History)

1. 背景与目标 (Background & Goals)

1.1 背景

1.2 产品愿景

1.3 目标

1.4 非目标 (Non-Goals)

2. 术语与定义 (Glossary)

3. 成功指标 (Success Metrics)

4. 目标用户与核心场景 (Personas & Key Scenarios)

4.1 用户角色

4.2 核心场景与优先级

5. 产品范围 (Scope)

5.1 In Scope

5.2 Out of Scope

6. 功能需求 (Functional Requirements)

6.1 Brief 与规则管理 [US-01, US-02, US-10A, US-10B]

6.2 脚本预审 (Pre-production) [US-03, US-04]

6.3 视频智能审核 (Post-production) [US-05, US-06, US-07]

6.4 审核台与人工复核 [US-08, US-09]

6.5 代理商管理

6.6 申诉与仲裁

6.7 版本差异与批量处理 [US-11, US-13]

6.8 AI 服务配置与连通性测试

7. 关键流程 (Key User Flows)

7.1 品牌方工作流

7.2 代理商工作流

7.3 达人工作流

8. 权限与多租户 (Permissions)

9. 数据与审计 (Data & Audit)

9.1 核心对象

9.2 审计要求 [US-12]

10. 非功能性需求 (NFR)

11. 假设与约束 (Assumptions & Constraints)

12. 合规原则与风控 (Compliance)

13. 技术架构概述 (Technical Architecture Overview)

14. 里程碑与发布计划 (Milestones)

15. 风险与开放问题 (Open Questions)

16. 相关文档 (References)

17. 缩略语 (Abbreviations)

21 KiB

Raw Blame History