Your Name ef08986c7c review gemini revisions

2026-01-30 21:59:29 +08:00

12 KiB

Raw Blame History

RequirementsDoc.md - 智能视频合规审核系统

文档类型	RD (Requirements Document)
项目名称	SmartAudit (AI 营销内容合规审核平台)
版本号	V1.0
发布日期	2026-01-30
状态	修订 (Revised)
侧重	商业背景、用户价值、用户故事、成功指标

1. 业务背景与市场机会 (Business Context)

1.1 市场现状

随着短视频营销（TikTok, 小红书, B站）成为品牌投放的主流阵地，品牌方每年需要审核数千甚至数万条达人视频。目前的审核流程存在严重瓶颈：

效率低下： 人工审核一条 3 分钟视频+对比 Brief 平均耗时 15-20 分钟，且需反复修改 3-5 轮。
标准不一： 不同审核员对“品牌调性”理解不同，导致达人无所适从。
风险高企： 人工疲劳导致漏判（如竞品露出、边缘违禁词），极易引发公关危机。

1.2 核心痛点

对于品牌方： 害怕由于达人“口无遮拦”或“价值观不当”导致品牌翻车。
对于代理商： 深陷于“传话筒”困境，大量人力浪费在检查错别字、Brief 对齐等低价值工作上。
对于达人： 痛恨模糊的反馈（如“感觉不对”），希望获得即时、明确的修改指令，以便尽快结算。

1.3 产品愿景

打造一款基于多模态大模型的 B2B SaaS 审核工具。它不是要取代人工，而是作为**“智能预审员”**，在人工介入前自动化拦截 80% 的基础错误和合规风险，将审核流转周期从“天”缩短到“小时”。

2. 术语与定义 (Glossary)

Brief： 品牌投放要求文件，包含卖点、禁忌、话术、素材规范等。
违禁词库： 平台与法律合规要求的规则集合（含极限词、功效词、敏感话题等）。
初审通过率： 仅经过 AI 预审后一次性通过的比例（不进入人工返工）。
召回率/误报率： 在标注测试集中，系统识别到“确实违规”的比例 / 误判为违规的比例。
Brand Safety： 涉及价值观、偏见、歧视、舆情争议等非硬性违规风险。
版本比对 (Diff)： 针对同一任务的不同版本视频，自动识别修改点和未修改点的能力。

3. 用户角色 (Personas)

角色	描述	核心动机 (Motivation)	典型行为
品牌方 MKT (Brand)	甲方市场部负责人，对内容安全负最终责任。	安全第一。宁可错杀，不可放过；维护品牌高端形象。	下达 Brief，抽查最终视频，处理严重争议。
代理商媒介 (Agency)	连接品牌与达人的中间方，系统的高频使用者。	效率至上。希望快速过审，减少沟通成本，同时管理上百个达人。	上传 Brief，初审达人作业，进行仲裁。
达人/KOL (Creator)	内容创作者，系统的被审核端。	通过率与结算。希望反馈明确，不要反复折腾。	上传脚本/视频，查看报错，申诉，修改。

4. 用户故事 (User Stories)

我们将需求拆解为具体的场景故事，以确保功能设计满足真实业务流。

4.1 场景一：任务启动与规则定义

[US-01] 作为 代理商，我希望能够直接上传各种格式的原始 Brief（PDF扫描件、Excel分镜表、Word文档）以及已授权的在线文档链接（如飞书/Notion分享链接），让系统自动提取出“核心卖点”和“禁忌词”，无需手动录入。
[US-02] 作为 品牌方，我希望系统能自动根据投放平台（如抖音、小红书）加载最新的平台违禁词库，确保 Brief 的要求不违反平台底线。

4.2 场景二：脚本预审 (Pre-production)

[US-03] 作为达人，我希望在拍摄前先提交文字脚本进行预审，让系统帮我检查是否遗漏了卖点或触犯了广告法，避免拍完重拍的巨大沉没成本。
[US-04] 作为达人，我希望审核系统能“读懂上下文”，不要因为我在讲故事时说了“最开心的一天”就报“广告极限词违规”，减少对创作的干扰。

4.3 场景三：视频智能审核 (Post-production)

[US-05] 作为 代理商，我希望系统能自动检测视频画面中是否出现了“竞品Logo”或“不雅背景”，并精确到秒数标出来，因为人工肉眼看视频很容易走神漏掉。
[US-06] 作为 品牌方，我希望系统具备“舆情敏感度”，能提示达人视频中是否存在“油腻”、“爹味说教”或“性别偏见”的内容，帮助我规避潜在的公关风险（Brand Safety）。
[US-07] 作为达人，我希望在视频上传后的等待期间能看到 AI 的处理进度（如“正在核对口播...”），并在审核完成后收到一份带时间戳的修改清单。

4.4 场景四：人工复核与决策

[US-08] 作为 代理商审核员，我希望在审核台看到 AI 已经标记好的风险点（红/黄/绿），我只需要点击确认或驳回，而不是从头把视频看一遍。
[US-09] 作为 品牌方，我希望拥有“强制通过权”，当 AI 因为过于保守而报错（例如达人玩了一个很新的梗）时，我可以手动放行，并让系统记住这个特例。

4.5 场景五：规则运营与审计

[US-10] 作为 品牌方合规/法务，我希望能配置“品牌私有规则”（如禁用词、竞品列表、白名单），并且对规则版本做可追溯的变更记录。
[US-11] 作为 代理商，我希望支持批量上传与批量导出审核报告，便于一次处理多条达人任务。
[US-12] 作为 品牌方，我希望在争议发生时能导出完整的审核证据链（时间戳、截图、规则依据、审核人）。

4.6 场景六：版本迭代与比对

[US-13] 作为 代理商，当达人上传修改版视频 (V2) 时，我希望看到 “新旧版本差异报告”，AI 明确告知“V1版本中指出的3个违规点，有2个已修复，1个未修复”，从而极大缩短复审时间。

5. 成功指标 (Success Metrics / KPIs)

如果项目上线后达到以下指标，视为成功：

审核效率提升 (Efficiency): 单条视频人工投入时长从平均 20 分钟 降低至 5 分钟（以 30 天样本统计）。
初审通过率 (Quality): 经过 AI 脚本预审后，首次通过率提升 ≥ 30%（对比上线前 30 天基线）。
风险拦截率 (Recall):
- 硬性合规 (Hard Rules): 针对违禁词、竞品 Logo 等客观指标，召回率 ≥ 95%，误报率 ≤ 5%。
- 软性风控 (Soft Sentiment): 针对舆情/价值观等主观指标，一致性（与人工复核结论一致）≥ 80%。
用户满意度 (NPS): 合作代理商的 NPS 提升 ≥ 10 分。

6. 高层功能列表 (High-Level Features)

✅ In Scope (核心功能)

全能文档解析引擎: 支持 PDF/Word/Excel/PPT/图片/在线链接的 Brief 自动解析与规则结构化。
多模态审核核心: 包含 NLP (文本/语义)、ASR (语音)、OCR (字幕)、CV (画面/物体) 综合检测能力。
分区执法逻辑: 智能区分“广告段”与“剧情段”，应用不同的审核尺度。
舆情风控雷达: 针对“油腻感”、“价值观风险”、“错别字”的专项检测模型。
交互式审核台: 支持时间戳打点、风险高亮、版本比对 (Diff) 的 Web 界面。
信用与申诉体系: 包含申诉令牌管理和人工仲裁流程。
规则库管理与版本控制: 支持平台规则库更新、品牌私有规则与白名单配置。
权限与多租户隔离: 支持品牌/代理/达人不同角色的权限与数据隔离。
审计日志与报告导出: 支持导出可追溯的审核证据链。

❌ Out of Scope (本期不做)

视频剪辑工具: 不提供在线剪辑功能，仅提供修改意见。
支付与结算: 不涉及品牌与达人的资金交易。
发布后数据监测: 不负责视频发布后的点赞/评论/转化数据分析。
自动下架/投诉处理: 不直接触发平台处罚或下架动作。
直播流/实时切片审核: 本期仅支持离线上传视频文件，不支持直播流的实时接入与毫秒级审核。

7. 假设与约束 (Assumptions & Constraints)

技术约束: 视频处理极其消耗算力，需接受“非实时”反馈（深度审核需 1-3 分钟延迟）。
数据隐私: 品牌方的 Brief 和私有数据必须严格隔离，不得用于训练通用模型。
平台依赖: 若抖音/小红书的审核规则发生重大变更，系统需在一个工作日内更新规则库。
规则来源: 具体合规规则由品牌/法务提供并确认，平台规则以官方公告为准。
在线文档接入: 仅支持用户授权的分享链接；不得绕过权限或抓取受限内容。
区域合规: 不同地区投放需切换对应法规与平台规则版本。

8. 非功能性需求 (Non-Functional Requirements)

可用性: 月度可用性 ≥ 99.5%，支持灰度发布与快速回滚。
性能: 1080p、≤ 100MB 视频生成报告 ≤ 5 分钟（排队时间不超过 2 分钟）。
安全: 传输与存储加密；基于角色的权限控制；关键操作二次确认。
数据保留: 默认保留原始视频/报告 30 天，可按品牌配置延长或缩短。
合规与隐私: 支持数据脱敏与最小化访问；操作日志可审计且不可篡改。

9. 验收标准 (Acceptance Criteria)

Brief 解析: 能够正确解析包含图文混排的 PDF Brief，提取准确率 > 90%。
多模态检测: 在标注测试集中，系统能识别画面角落里遮挡 30% 的竞品 Logo，F1 ≥ 0.85。
语义理解: 对广告极限词与非广告语境的区分误报率 ≤ 5%（样本量 ≥ 1,000 句）。
ASR/OCR: 普通话 ASR 字错率 ≤ 10%，字幕 OCR 字准确率 ≥ 95%（含复杂背景）。
性能: 100MB 以内的视频上传后，AI 预审报告产出时间不超过 5 分钟。
审计链路: 每条结论包含规则版本、模型版本、证据截图/片段与时间戳。

10. 风险与合规原则 (Risks & Compliance Principles)

10.1 系统合规性原则

规则来源合法： 所有审核标准均需基于公开法律法规、平台官方规则或品牌方授权的私有 Brief；不得未经授权抓取或绕过登录限制。
可解释与可申诉： AI 不做黑盒决策，每条结论必须给出证据片段与规则依据，并支持申诉与人工仲裁。
数据授权与最小化： 训练与评测数据需确保授权合规；默认最小化留存，过期自动清理。
辅助决策定位： 系统明确定义为“辅助工具”，不直接触发下架、投诉或平台处罚动作，最终责任由人工操作员承担。
偏见与歧视控制： 涉及主观评价的模型需经过偏见评估与定期复核，确保结论可解释且可追溯。

10.2 开放问题 (Open Questions)

规则迭代频率： 是否需要与平台建立订阅机制，规则更新 SLA 如何定义？
训练数据来源： 标注成本、数据授权路径与敏感数据脱敏策略如何确定？
舆情判断边界： “油腻/爹味”等主观标签需要谁来兜底决策？
多语言支持： 海外投放或多语种内容是否纳入本期范围？

12 KiB Raw Blame History Unescape Escape