From ef08986c7c61d054f967b891e2c82eb80e2cfd0b Mon Sep 17 00:00:00 2001 From: Your Name Date: Fri, 30 Jan 2026 21:59:29 +0800 Subject: [PATCH] review gemini revisions --- RequirementsDoc.md | 69 ++++++++++++++++++++-------------------------- 1 file changed, 30 insertions(+), 39 deletions(-) diff --git a/RequirementsDoc.md b/RequirementsDoc.md index 036cfdc..dd4f647 100644 --- a/RequirementsDoc.md +++ b/RequirementsDoc.md @@ -5,7 +5,7 @@ | **项目名称** | SmartAudit (AI 营销内容合规审核平台) | | **版本号** | V1.0 | | **发布日期** | 2026-01-30 | -| **状态** | 草稿 (Draft) | +| **状态** | **修订 (Revised)** | | **侧重** | 商业背景、用户价值、用户故事、成功指标 | --- @@ -39,6 +39,7 @@ * **初审通过率:** 仅经过 AI 预审后一次性通过的比例(不进入人工返工)。 * **召回率/误报率:** 在标注测试集中,系统识别到“确实违规”的比例 / 误判为违规的比例。 * **Brand Safety:** 涉及价值观、偏见、歧视、舆情争议等非硬性违规风险。 +* **版本比对 (Diff):** 针对同一任务的不同版本视频,自动识别修改点和未修改点的能力。 --- @@ -56,33 +57,37 @@ 我们将需求拆解为具体的场景故事,以确保功能设计满足真实业务流。 -### 3.1 场景一:任务启动与规则定义 +### 4.1 场景一:任务启动与规则定义 -* **[US-01]** 作为 **代理商**,我希望能够直接上传各种格式的原始 Brief(PDF扫描件、Excel分镜表、Word文档),让系统自动提取出“核心卖点”和“禁忌词”,而不需要我手动一条条录入,以节省配置时间。 +* **[US-01]** 作为 **代理商**,我希望能够直接上传各种格式的原始 Brief(PDF扫描件、Excel分镜表、Word文档)**以及已授权的在线文档链接(如飞书/Notion分享链接)**,让系统自动提取出“核心卖点”和“禁忌词”,无需手动录入。 * **[US-02]** 作为 **品牌方**,我希望系统能自动根据投放平台(如抖音、小红书)加载最新的平台违禁词库,确保 Brief 的要求不违反平台底线。 -### 3.2 场景二:脚本预审 (Pre-production) +### 4.2 场景二:脚本预审 (Pre-production) * **[US-03]** 作为 **达人**,我希望在拍摄前先提交文字脚本进行预审,让系统帮我检查是否遗漏了卖点或触犯了广告法,避免拍完重拍的巨大沉没成本。 * **[US-04]** 作为 **达人**,我希望审核系统能“读懂上下文”,不要因为我在讲故事时说了“最开心的一天”就报“广告极限词违规”,减少对创作的干扰。 -### 3.3 场景三:视频智能审核 (Post-production) +### 4.3 场景三:视频智能审核 (Post-production) * **[US-05]** 作为 **代理商**,我希望系统能自动检测视频画面中是否出现了“竞品Logo”或“不雅背景”,并精确到秒数标出来,因为人工肉眼看视频很容易走神漏掉。 * **[US-06]** 作为 **品牌方**,我希望系统具备“舆情敏感度”,能提示达人视频中是否存在“油腻”、“爹味说教”或“性别偏见”的内容,帮助我规避潜在的公关风险(Brand Safety)。 * **[US-07]** 作为 **达人**,我希望在视频上传后的等待期间能看到 AI 的处理进度(如“正在核对口播...”),并在审核完成后收到一份带时间戳的修改清单。 -### 3.4 场景四:人工复核与决策 +### 4.4 场景四:人工复核与决策 * **[US-08]** 作为 **代理商审核员**,我希望在审核台看到 AI 已经标记好的风险点(红/黄/绿),我只需要点击确认或驳回,而不是从头把视频看一遍。 * **[US-09]** 作为 **品牌方**,我希望拥有“强制通过权”,当 AI 因为过于保守而报错(例如达人玩了一个很新的梗)时,我可以手动放行,并让系统记住这个特例。 -### 3.5 场景五:规则运营与审计 +### 4.5 场景五:规则运营与审计 * **[US-10]** 作为 **品牌方合规/法务**,我希望能配置“品牌私有规则”(如禁用词、竞品列表、白名单),并且对规则版本做可追溯的变更记录。 * **[US-11]** 作为 **代理商**,我希望支持批量上传与批量导出审核报告,便于一次处理多条达人任务。 * **[US-12]** 作为 **品牌方**,我希望在争议发生时能导出完整的审核证据链(时间戳、截图、规则依据、审核人)。 +### 4.6 场景六:版本迭代与比对 + +* **[US-13]** 作为 **代理商**,当达人上传修改版视频 (V2) 时,我希望看到 **“新旧版本差异报告”**,AI 明确告知“V1版本中指出的3个违规点,有2个已修复,1个未修复”,从而极大缩短复审时间。 + --- ## 5. 成功指标 (Success Metrics / KPIs) @@ -91,18 +96,19 @@ 1. **审核效率提升 (Efficiency):** 单条视频人工投入时长从平均 **20 分钟** 降低至 **5 分钟**(以 30 天样本统计)。 2. **初审通过率 (Quality):** 经过 AI 脚本预审后,首次通过率提升 **≥ 30%**(对比上线前 30 天基线)。 -3. **风险拦截率 (Recall):** 在标注测试集中,硬性合规问题召回率 **≥ 95%**,同时误报率 **≤ 5%**。 +3. **风险拦截率 (Recall):** + * **硬性合规 (Hard Rules):** 针对违禁词、竞品 Logo 等客观指标,召回率 **≥ 95%**,误报率 **≤ 5%**。 + * **软性风控 (Soft Sentiment):** 针对舆情/价值观等主观指标,**一致性**(与人工复核结论一致)**≥ 80%**。 + 4. **用户满意度 (NPS):** 合作代理商的 NPS 提升 **≥ 10 分**。 --- ## 6. 高层功能列表 (High-Level Features) -本部分定义项目的**范围 (Scope)**,明确做什么,不做什么。 - ### ✅ In Scope (核心功能) -1. **全能文档解析引擎:** 支持 PDF/Word/Excel/PPT/图片 的 Brief 自动解析与规则结构化。 +1. **全能文档解析引擎:** 支持 PDF/Word/Excel/PPT/图片/在线链接 的 Brief 自动解析与规则结构化。 2. **多模态审核核心:** 包含 NLP (文本/语义)、ASR (语音)、OCR (字幕)、CV (画面/物体) 综合检测能力。 3. **分区执法逻辑:** 智能区分“广告段”与“剧情段”,应用不同的审核尺度。 4. **舆情风控雷达:** 针对“油腻感”、“价值观风险”、“错别字”的专项检测模型。 @@ -116,8 +122,9 @@ 1. **视频剪辑工具:** 不提供在线剪辑功能,仅提供修改意见。 2. **支付与结算:** 不涉及品牌与达人的资金交易。 -3. **发布后数据监测:** 不负责视频发布后的点赞/评论/转化数据分析(那是星图/蒲公英平台的事)。 +3. **发布后数据监测:** 不负责视频发布后的点赞/评论/转化数据分析。 4. **自动下架/投诉处理:** 不直接触发平台处罚或下架动作。 +5. **直播流/实时切片审核:** 本期仅支持离线上传视频文件,不支持直播流的实时接入与毫秒级审核。 --- @@ -127,7 +134,8 @@ * **数据隐私:** 品牌方的 Brief 和私有数据必须严格隔离,不得用于训练通用模型。 * **平台依赖:** 若抖音/小红书的审核规则发生重大变更,系统需在一个工作日内更新规则库。 * **规则来源:** 具体合规规则由品牌/法务提供并确认,平台规则以官方公告为准。 -* **可解释性:** 所有违规提示需给出规则依据与证据片段,便于人工复核。 +* **在线文档接入:** 仅支持用户授权的分享链接;不得绕过权限或抓取受限内容。 +* **区域合规:** 不同地区投放需切换对应法规与平台规则版本。 --- @@ -137,7 +145,7 @@ * **性能:** 1080p、≤ 100MB 视频生成报告 ≤ 5 分钟(排队时间不超过 2 分钟)。 * **安全:** 传输与存储加密;基于角色的权限控制;关键操作二次确认。 * **数据保留:** 默认保留原始视频/报告 30 天,可按品牌配置延长或缩短。 -* **可观测性:** 关键路径日志、指标、告警齐全(失败率、处理时延、模型版本)。 +* **合规与隐私:** 支持数据脱敏与最小化访问;操作日志可审计且不可篡改。 --- @@ -152,36 +160,19 @@ --- -## 10. 合规建议与开放问题 (Compliance Suggestions & Open Questions) +## 10. 风险与合规原则 (Risks & Compliance Principles) -### 10.1 合规建议(与 Gemini 建议对齐后的版本) +### 10.1 系统合规性原则 -* **规则来源合规:** 平台规则仅以官方公告/接口为准;不做未经授权的自动抓取;规则变更需留痕与可回滚。 -* **人类最终裁决:** 对主观风险(价值观、舆情、偏见)必须保留人工复核入口,系统仅提供证据与建议等级。 -* **可解释与可申诉:** 每条结论必须给出证据片段与规则依据,并支持申诉与人工仲裁。 +* **规则来源合法:** 所有审核标准均需基于公开法律法规、平台官方规则或品牌方授权的私有 Brief;不得未经授权抓取或绕过登录限制。 +* **可解释与可申诉:** AI 不做黑盒决策,每条结论必须给出证据片段与规则依据,并支持申诉与人工仲裁。 * **数据授权与最小化:** 训练与评测数据需确保授权合规;默认最小化留存,过期自动清理。 -* **不自动处罚:** 系统只输出建议,不直接触发下架、投诉或平台处罚动作。 +* **辅助决策定位:** 系统明确定义为“辅助工具”,不直接触发下架、投诉或平台处罚动作,最终责任由人工操作员承担。 +* **偏见与歧视控制:** 涉及主观评价的模型需经过偏见评估与定期复核,确保结论可解释且可追溯。 -### 10.2 开放问题 +### 10.2 开放问题 (Open Questions) * **规则迭代频率:** 是否需要与平台建立订阅机制,规则更新 SLA 如何定义? * **训练数据来源:** 标注成本、数据授权路径与敏感数据脱敏策略如何确定? -* **舆情判断边界:** 主观标签由谁定标?品牌侧与代理侧冲突如何仲裁? +* **舆情判断边界:** “油腻/爹味”等主观标签需要谁来兜底决策? * **多语言支持:** 海外投放或多语种内容是否纳入本期范围? -修改 1:优化《5. 成功指标》 -5. 成功指标 (Success Metrics / KPIs) ... 3. 风险拦截率 (Recall): - -硬性合规 (Hard Rules): 针对违禁词、竞品 Logo 等客观指标,召回率 ≥ 95%。 - -软性风控 (Soft Sentiment): 针对油腻感、价值观等主观指标,用户认可度/准确率 ≥ 80%。 ... - -修改 2:明确《6. High-Level Features》的范围 -6. High-Level Features ... ❌ Out of Scope (本期不做) ... 4. 自动下架/投诉处理: 不直接触发平台处罚或下架动作。 5. 直播流/实时切片审核: 本期仅支持离线上传视频文件,不支持直播流的实时接入与毫秒级审核。 - -修改 3:补充 User Story 到《4. 用户故事》 -3.6 场景六:版本迭代与比对 (New) - -[US-13] 作为 代理商,当达人上传修改版视频 (V2) 时,我希望看到 “新旧版本差异报告”,AI 明确告知“V1版本中指出的3个违规点,有2个已修复,1个未修复”,从而极大缩短复审时间。 - -修改 4:补充 Brief 来源支持 -[US-01] ...支持上传各种格式的原始 Brief(PDF、Word...)以及主流在线文档链接(如飞书/Notion公开链接)...