应用指南

视频内容审核中的人工智能

人工智能审查上传和直播的视频,检测暴力、裸体或仇恨言论等有害内容,速度远远快于人类主持人的单独审查速度。

概述

人工智能审查上传和直播的视频,检测暴力、裸体或仇恨言论等有害内容,速度远远快于人类主持人的单独审查速度。这很重要,因为平台每分钟都会收到数百小时的视频,使得大规模的手动审核变得不可能。

视频内容审核中的人工智能侧重于实际部署:将模型功能转化为可靠的日常工作流程,提供可衡量的价值。

深入探讨

视频审核是多模式的:单个剪辑包含图像、动作、音频和屏幕文本。系统对帧进行采样并运行计算机视觉分类器来识别裸体、武器、血腥或极端主义符号;他们分析跨帧的运动来标记暴力行为;语音到文本转录音频,以便 NLP 模型可以捕获仇恨言论或威胁;光学字符识别可以读取视频上覆盖的文本。一项关键技术是散列:已知的有害视频(例如恐怖分子宣传或虐待儿童的材料)被转换为数字指纹,因此无需重新分析即可立即阻止重新上传。由于背景很重要,展示暴力的新闻报道不同于美化暴力的新闻报道,大多数平台都使用人工智能来分类和优先排序,然后将模棱两可的案件发送给人工审查员。

技术洞察

感知哈希(例如用于图像的 PhotoDNA 和 PDQ,以及视频哈希变体)会生成对调整大小、重新压缩或细微编辑具有鲁棒性的指纹,因此稍作修改的重新上传仍会与共享行业数据库中已知的错误条目匹配。对于新颖的内容,深度分类器在采样帧和音频片段上运行,产生置信度分数;只有靠近决策边界的项目才会升级给人类,这使得成本和延迟在数十亿次上传时处于可控状态。

掌握视频内容审核中的人工智能

人工智能审查上传和直播的视频,检测暴力、裸体或仇恨言论等有害内容,速度远远快于人类主持人的单独审查速度。这很重要,因为平台每分钟都会收到数百小时的视频,使得大规模的手动审核变得不可能。视频内容审核中的人工智能侧重于实际部署:将模型功能转化为可靠的日常工作流程,提供可衡量的价值。为了建立深入的理解,请将视频内容审核中的人工智能视为一种操作模型,而不是单一功能:定义期望的结果,澄清假设,并将系统可以可靠地完成的任务与仍需要专家判断的任务分开。

在实践中,在视频内容审核中使用人工智能的强大团队专注于工作流程结果,而不是模型演示,并尽早定义人工检查点。他们记录明确的成功标准,根据实际数据和工作流程进行测试,并根据观察到的失败模式而不是一次性基准测试胜利进行迭代。这就是理论理解转变为跨产品、政策和运营的持久能力的地方。

应用级设计决定了人工智能是否能改善实际结果。与此同时,将损坏的流程自动化可能会加剧现有的问题。最具弹性的方法是将实验速度与治理规则结合起来:运行试点、捕获证据、发布决策日志,并随着模型行为、用户期望和监管要求的发展不断更新保障措施。

战略影响

应用级设计决定了人工智能是否能改善实际结果。

应用级设计决定了人工智能是否能改善实际结果。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

良好的工作流程集成可以创造用户值得信赖的生产力收益。

良好的工作流程集成可以创造用户值得信赖的生产力收益。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

范围明确的用例可以减少变更疲劳和实施风险。

范围明确的用例可以减少变更疲劳和实施风险。在高质量部署中,这会转化为可衡量的操作规则、所有权边界和定期审查仪式,以便团队可以增强信心,而不是扩大模糊性。

人工智能在视频内容审核中的未来

模型正在朝着真正的视频理解方向发展,对整个剪辑的叙述而不是孤立的帧进行推理,这有助于将记录与美化分开。直播的实时审核成为备受瞩目的失败之后的主要焦点。与此同时,生成式人工智能使深度伪造和合成滥用内容更容易生成,因此检测人工智能生成和操纵的视频以及出处标签正成为信任和安全工作的核心。

现实世界的实施

YouTube 自动检测和限制年龄或删除上传的暴力和裸体图片

Meta 和其他平台使用共享哈希数据库(通过 GIFCT)来阻止跨服务的已知恐怖分子宣传

TikTok 近乎实时地扫描直播,以中断裸露或自残内容

平台转录音频以捕捉视频中的仇恨言论和威胁,而不仅仅是视觉上显示

实施模式

视频内容审核中的人工智能实践

YouTube 会自动检测并限制年龄或删除上传的暴力和裸体图片。

YouTube 自动检测和限制年龄或删除上传中的暴力和裸露图片。当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时,通常会获得更好的结果。

视频内容审核中的人工智能实践

Meta 和其他平台使用共享哈希数据库(通过 GIFCT)来阻止跨服务的已知恐怖分子宣传。

Meta 和其他平台使用共享哈希数据库(通过 GIFCT)来阻止跨服务的已知恐怖分子宣传。当团队预先定义质量阈值、为边缘情况保留人为升级路径并随着时间的推移跟踪生产力增益和错误成本时,通常会得到更好的结果。

视频内容审核中的人工智能实践

TikTok 近乎实时地扫描直播,以中断裸露或自残内容。

TikTok 近乎实时地扫描直播,以中断裸露或自残内容。当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时,通常会得到更好的结果。

视频内容审核中的人工智能实践

平台转录音频以捕捉视频中的仇恨言论和威胁,而不仅仅是视觉上显示。

转录音频以捕捉视频中的仇恨言论和威胁的平台,而不仅仅是以视觉方式显示。当团队预先定义质量阈值、为边缘情况保留人工升级路径并跟踪一段时间内的生产力提升和错误成本时,通常会获得更好的结果。

风险与防护栏

!

将损坏的流程自动化可能会加剧现有问题。

!

团队可能会过度自动化并消除所需的人工判断。

!

如果不持续评估输出,质量可能会出现偏差。

实施路线图

1

绘制当前工作流程并确定摩擦最大的步骤。

绘制当前工作流程并确定摩擦最大的步骤。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

2

在完全自动化之前定义人工检查点。

在完全自动化之前定义人工检查点。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

3

对用户进行提示、升级路径和质量标准方面的培训。

对用户进行提示、升级路径和质量标准方面的培训。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

4

跟踪任务级结果以确认持续价值。

跟踪任务级结果以确认持续价值。将每个步骤视为证据门:如果不满足标准,则暂停推出,缩小差距,然后再扩大使用。

不断探索