review gemini revisions

This commit is contained in:
Your Name 2026-01-30 21:59:29 +08:00
parent e8f8dd48cb
commit ef08986c7c

View File

@ -5,7 +5,7 @@
| **项目名称** | SmartAudit (AI 营销内容合规审核平台) | | **项目名称** | SmartAudit (AI 营销内容合规审核平台) |
| **版本号** | V1.0 | | **版本号** | V1.0 |
| **发布日期** | 2026-01-30 | | **发布日期** | 2026-01-30 |
| **状态** | 草稿 (Draft) | | **状态** | **修订 (Revised)** |
| **侧重** | 商业背景、用户价值、用户故事、成功指标 | | **侧重** | 商业背景、用户价值、用户故事、成功指标 |
--- ---
@ -39,6 +39,7 @@
* **初审通过率:** 仅经过 AI 预审后一次性通过的比例(不进入人工返工)。 * **初审通过率:** 仅经过 AI 预审后一次性通过的比例(不进入人工返工)。
* **召回率/误报率:** 在标注测试集中,系统识别到“确实违规”的比例 / 误判为违规的比例。 * **召回率/误报率:** 在标注测试集中,系统识别到“确实违规”的比例 / 误判为违规的比例。
* **Brand Safety** 涉及价值观、偏见、歧视、舆情争议等非硬性违规风险。 * **Brand Safety** 涉及价值观、偏见、歧视、舆情争议等非硬性违规风险。
* **版本比对 (Diff)** 针对同一任务的不同版本视频,自动识别修改点和未修改点的能力。
--- ---
@ -56,33 +57,37 @@
我们将需求拆解为具体的场景故事,以确保功能设计满足真实业务流。 我们将需求拆解为具体的场景故事,以确保功能设计满足真实业务流。
### 3.1 场景一:任务启动与规则定义 ### 4.1 场景一:任务启动与规则定义
* **[US-01]** 作为 **代理商**,我希望能够直接上传各种格式的原始 BriefPDF扫描件、Excel分镜表、Word文档让系统自动提取出“核心卖点”和“禁忌词”而不需要我手动一条条录入,以节省配置时间 * **[US-01]** 作为 **代理商**,我希望能够直接上传各种格式的原始 BriefPDF扫描件、Excel分镜表、Word文档**以及已授权的在线文档链接(如飞书/Notion分享链接**,让系统自动提取出“核心卖点”和“禁忌词”,无需手动录入
* **[US-02]** 作为 **品牌方**,我希望系统能自动根据投放平台(如抖音、小红书)加载最新的平台违禁词库,确保 Brief 的要求不违反平台底线。 * **[US-02]** 作为 **品牌方**,我希望系统能自动根据投放平台(如抖音、小红书)加载最新的平台违禁词库,确保 Brief 的要求不违反平台底线。
### 3.2 场景二:脚本预审 (Pre-production) ### 4.2 场景二:脚本预审 (Pre-production)
* **[US-03]** 作为 **达人**,我希望在拍摄前先提交文字脚本进行预审,让系统帮我检查是否遗漏了卖点或触犯了广告法,避免拍完重拍的巨大沉没成本。 * **[US-03]** 作为 **达人**,我希望在拍摄前先提交文字脚本进行预审,让系统帮我检查是否遗漏了卖点或触犯了广告法,避免拍完重拍的巨大沉没成本。
* **[US-04]** 作为 **达人**,我希望审核系统能“读懂上下文”,不要因为我在讲故事时说了“最开心的一天”就报“广告极限词违规”,减少对创作的干扰。 * **[US-04]** 作为 **达人**,我希望审核系统能“读懂上下文”,不要因为我在讲故事时说了“最开心的一天”就报“广告极限词违规”,减少对创作的干扰。
### 3.3 场景三:视频智能审核 (Post-production) ### 4.3 场景三:视频智能审核 (Post-production)
* **[US-05]** 作为 **代理商**我希望系统能自动检测视频画面中是否出现了“竞品Logo”或“不雅背景”并精确到秒数标出来因为人工肉眼看视频很容易走神漏掉。 * **[US-05]** 作为 **代理商**我希望系统能自动检测视频画面中是否出现了“竞品Logo”或“不雅背景”并精确到秒数标出来因为人工肉眼看视频很容易走神漏掉。
* **[US-06]** 作为 **品牌方**我希望系统具备“舆情敏感度”能提示达人视频中是否存在“油腻”、“爹味说教”或“性别偏见”的内容帮助我规避潜在的公关风险Brand Safety * **[US-06]** 作为 **品牌方**我希望系统具备“舆情敏感度”能提示达人视频中是否存在“油腻”、“爹味说教”或“性别偏见”的内容帮助我规避潜在的公关风险Brand Safety
* **[US-07]** 作为 **达人**,我希望在视频上传后的等待期间能看到 AI 的处理进度(如“正在核对口播...”),并在审核完成后收到一份带时间戳的修改清单。 * **[US-07]** 作为 **达人**,我希望在视频上传后的等待期间能看到 AI 的处理进度(如“正在核对口播...”),并在审核完成后收到一份带时间戳的修改清单。
### 3.4 场景四:人工复核与决策 ### 4.4 场景四:人工复核与决策
* **[US-08]** 作为 **代理商审核员**,我希望在审核台看到 AI 已经标记好的风险点(红/黄/绿),我只需要点击确认或驳回,而不是从头把视频看一遍。 * **[US-08]** 作为 **代理商审核员**,我希望在审核台看到 AI 已经标记好的风险点(红/黄/绿),我只需要点击确认或驳回,而不是从头把视频看一遍。
* **[US-09]** 作为 **品牌方**,我希望拥有“强制通过权”,当 AI 因为过于保守而报错(例如达人玩了一个很新的梗)时,我可以手动放行,并让系统记住这个特例。 * **[US-09]** 作为 **品牌方**,我希望拥有“强制通过权”,当 AI 因为过于保守而报错(例如达人玩了一个很新的梗)时,我可以手动放行,并让系统记住这个特例。
### 3.5 场景五:规则运营与审计 ### 4.5 场景五:规则运营与审计
* **[US-10]** 作为 **品牌方合规/法务**,我希望能配置“品牌私有规则”(如禁用词、竞品列表、白名单),并且对规则版本做可追溯的变更记录。 * **[US-10]** 作为 **品牌方合规/法务**,我希望能配置“品牌私有规则”(如禁用词、竞品列表、白名单),并且对规则版本做可追溯的变更记录。
* **[US-11]** 作为 **代理商**,我希望支持批量上传与批量导出审核报告,便于一次处理多条达人任务。 * **[US-11]** 作为 **代理商**,我希望支持批量上传与批量导出审核报告,便于一次处理多条达人任务。
* **[US-12]** 作为 **品牌方**,我希望在争议发生时能导出完整的审核证据链(时间戳、截图、规则依据、审核人)。 * **[US-12]** 作为 **品牌方**,我希望在争议发生时能导出完整的审核证据链(时间戳、截图、规则依据、审核人)。
### 4.6 场景六:版本迭代与比对
* **[US-13]** 作为 **代理商**,当达人上传修改版视频 (V2) 时,我希望看到 **“新旧版本差异报告”**AI 明确告知“V1版本中指出的3个违规点有2个已修复1个未修复”从而极大缩短复审时间。
--- ---
## 5. 成功指标 (Success Metrics / KPIs) ## 5. 成功指标 (Success Metrics / KPIs)
@ -91,18 +96,19 @@
1. **审核效率提升 (Efficiency):** 单条视频人工投入时长从平均 **20 分钟** 降低至 **5 分钟**(以 30 天样本统计)。 1. **审核效率提升 (Efficiency):** 单条视频人工投入时长从平均 **20 分钟** 降低至 **5 分钟**(以 30 天样本统计)。
2. **初审通过率 (Quality):** 经过 AI 脚本预审后,首次通过率提升 **≥ 30%**(对比上线前 30 天基线)。 2. **初审通过率 (Quality):** 经过 AI 脚本预审后,首次通过率提升 **≥ 30%**(对比上线前 30 天基线)。
3. **风险拦截率 (Recall):** 在标注测试集中,硬性合规问题召回率 **≥ 95%**,同时误报率 **≤ 5%**。 3. **风险拦截率 (Recall):**
* **硬性合规 (Hard Rules):** 针对违禁词、竞品 Logo 等客观指标,召回率 **≥ 95%**,误报率 **≤ 5%**。
* **软性风控 (Soft Sentiment):** 针对舆情/价值观等主观指标,**一致性**(与人工复核结论一致)**≥ 80%**。
4. **用户满意度 (NPS):** 合作代理商的 NPS 提升 **≥ 10 分**。 4. **用户满意度 (NPS):** 合作代理商的 NPS 提升 **≥ 10 分**。
--- ---
## 6. 高层功能列表 (High-Level Features) ## 6. 高层功能列表 (High-Level Features)
本部分定义项目的**范围 (Scope)**,明确做什么,不做什么。
### ✅ In Scope (核心功能) ### ✅ In Scope (核心功能)
1. **全能文档解析引擎:** 支持 PDF/Word/Excel/PPT/图片 的 Brief 自动解析与规则结构化。 1. **全能文档解析引擎:** 支持 PDF/Word/Excel/PPT/图片/在线链接 的 Brief 自动解析与规则结构化。
2. **多模态审核核心:** 包含 NLP (文本/语义)、ASR (语音)、OCR (字幕)、CV (画面/物体) 综合检测能力。 2. **多模态审核核心:** 包含 NLP (文本/语义)、ASR (语音)、OCR (字幕)、CV (画面/物体) 综合检测能力。
3. **分区执法逻辑:** 智能区分“广告段”与“剧情段”,应用不同的审核尺度。 3. **分区执法逻辑:** 智能区分“广告段”与“剧情段”,应用不同的审核尺度。
4. **舆情风控雷达:** 针对“油腻感”、“价值观风险”、“错别字”的专项检测模型。 4. **舆情风控雷达:** 针对“油腻感”、“价值观风险”、“错别字”的专项检测模型。
@ -116,8 +122,9 @@
1. **视频剪辑工具:** 不提供在线剪辑功能,仅提供修改意见。 1. **视频剪辑工具:** 不提供在线剪辑功能,仅提供修改意见。
2. **支付与结算:** 不涉及品牌与达人的资金交易。 2. **支付与结算:** 不涉及品牌与达人的资金交易。
3. **发布后数据监测:** 不负责视频发布后的点赞/评论/转化数据分析(那是星图/蒲公英平台的事) 3. **发布后数据监测:** 不负责视频发布后的点赞/评论/转化数据分析。
4. **自动下架/投诉处理:** 不直接触发平台处罚或下架动作。 4. **自动下架/投诉处理:** 不直接触发平台处罚或下架动作。
5. **直播流/实时切片审核:** 本期仅支持离线上传视频文件,不支持直播流的实时接入与毫秒级审核。
--- ---
@ -127,7 +134,8 @@
* **数据隐私:** 品牌方的 Brief 和私有数据必须严格隔离,不得用于训练通用模型。 * **数据隐私:** 品牌方的 Brief 和私有数据必须严格隔离,不得用于训练通用模型。
* **平台依赖:** 若抖音/小红书的审核规则发生重大变更,系统需在一个工作日内更新规则库。 * **平台依赖:** 若抖音/小红书的审核规则发生重大变更,系统需在一个工作日内更新规则库。
* **规则来源:** 具体合规规则由品牌/法务提供并确认,平台规则以官方公告为准。 * **规则来源:** 具体合规规则由品牌/法务提供并确认,平台规则以官方公告为准。
* **可解释性:** 所有违规提示需给出规则依据与证据片段,便于人工复核。 * **在线文档接入:** 仅支持用户授权的分享链接;不得绕过权限或抓取受限内容。
* **区域合规:** 不同地区投放需切换对应法规与平台规则版本。
--- ---
@ -137,7 +145,7 @@
* **性能:** 1080p、≤ 100MB 视频生成报告 ≤ 5 分钟(排队时间不超过 2 分钟)。 * **性能:** 1080p、≤ 100MB 视频生成报告 ≤ 5 分钟(排队时间不超过 2 分钟)。
* **安全:** 传输与存储加密;基于角色的权限控制;关键操作二次确认。 * **安全:** 传输与存储加密;基于角色的权限控制;关键操作二次确认。
* **数据保留:** 默认保留原始视频/报告 30 天,可按品牌配置延长或缩短。 * **数据保留:** 默认保留原始视频/报告 30 天,可按品牌配置延长或缩短。
* **可观测性:** 关键路径日志、指标、告警齐全(失败率、处理时延、模型版本) * **合规与隐私:** 支持数据脱敏与最小化访问;操作日志可审计且不可篡改
--- ---
@ -152,36 +160,19 @@
--- ---
## 10. 合规建议与开放问题 (Compliance Suggestions & Open Questions) ## 10. 风险与合规原则 (Risks & Compliance Principles)
### 10.1 合规建议(与 Gemini 建议对齐后的版本) ### 10.1 系统合规性原则
* **规则来源合规:** 平台规则仅以官方公告/接口为准;不做未经授权的自动抓取;规则变更需留痕与可回滚。 * **规则来源合法:** 所有审核标准均需基于公开法律法规、平台官方规则或品牌方授权的私有 Brief不得未经授权抓取或绕过登录限制。
* **人类最终裁决:** 对主观风险(价值观、舆情、偏见)必须保留人工复核入口,系统仅提供证据与建议等级。 * **可解释与可申诉:** AI 不做黑盒决策,每条结论必须给出证据片段与规则依据,并支持申诉与人工仲裁。
* **可解释与可申诉:** 每条结论必须给出证据片段与规则依据,并支持申诉与人工仲裁。
* **数据授权与最小化:** 训练与评测数据需确保授权合规;默认最小化留存,过期自动清理。 * **数据授权与最小化:** 训练与评测数据需确保授权合规;默认最小化留存,过期自动清理。
* **不自动处罚:** 系统只输出建议,不直接触发下架、投诉或平台处罚动作。 * **辅助决策定位:** 系统明确定义为“辅助工具”,不直接触发下架、投诉或平台处罚动作,最终责任由人工操作员承担。
* **偏见与歧视控制:** 涉及主观评价的模型需经过偏见评估与定期复核,确保结论可解释且可追溯。
### 10.2 开放问题 ### 10.2 开放问题 (Open Questions)
* **规则迭代频率:** 是否需要与平台建立订阅机制,规则更新 SLA 如何定义? * **规则迭代频率:** 是否需要与平台建立订阅机制,规则更新 SLA 如何定义?
* **训练数据来源:** 标注成本、数据授权路径与敏感数据脱敏策略如何确定? * **训练数据来源:** 标注成本、数据授权路径与敏感数据脱敏策略如何确定?
* **舆情判断边界:** 主观标签由谁定标?品牌侧与代理侧冲突如何仲裁 * **舆情判断边界:** “油腻/爹味”等主观标签需要谁来兜底决策
* **多语言支持:** 海外投放或多语种内容是否纳入本期范围? * **多语言支持:** 海外投放或多语种内容是否纳入本期范围?
修改 1优化《5. 成功指标》
5. 成功指标 (Success Metrics / KPIs) ... 3. 风险拦截率 (Recall):
硬性合规 (Hard Rules): 针对违禁词、竞品 Logo 等客观指标,召回率 ≥ 95%。
软性风控 (Soft Sentiment): 针对油腻感、价值观等主观指标,用户认可度/准确率 ≥ 80%。 ...
修改 2明确《6. High-Level Features》的范围
6. High-Level Features ... ❌ Out of Scope (本期不做) ... 4. 自动下架/投诉处理: 不直接触发平台处罚或下架动作。 5. 直播流/实时切片审核: 本期仅支持离线上传视频文件,不支持直播流的实时接入与毫秒级审核。
修改 3补充 User Story 到《4. 用户故事》
3.6 场景六:版本迭代与比对 (New)
[US-13] 作为 代理商,当达人上传修改版视频 (V2) 时,我希望看到 “新旧版本差异报告”AI 明确告知“V1版本中指出的3个违规点有2个已修复1个未修复”从而极大缩短复审时间。
修改 4补充 Brief 来源支持
[US-01] ...支持上传各种格式的原始 BriefPDF、Word...)以及主流在线文档链接(如飞书/Notion公开链接...