短视频标注新政落地!如何破解内容识别与存量补标难题?

在AIGC内容快速渗透与短视频生态积极扩张的背景下,短视频内容生产正呈现出明显的多元化与复杂化趋势。

5月12日,中央网信办发布关于规范短视频内容标注工作的部署,明确将内容标注设为短视频发布的必经环节,要求平台统一提供六类 “必选标签”,同时对存量短视频开展分批回溯补标,并强调对未按要求落实标注、主体责任不到位的平台与账号,将依法严惩并公开曝光。

图片

图源:中国网信网

这标志着短视频行业正在从“事后审核”迈入“事前标注”为核心的新阶段。但在实际落地过程中,平台面临的核心问题并不在于规则本身,而在于如何在海量的复杂内容中,提高精细化、规模化的标注能力。

图片

短视频内容标注落地面临的挑战

从当前实践来看,短视频内容标注主要面临两类难题:

1.AIGC内容与营销信息识别难度攀升

随着生成式AI能力提升与内容商业化深化,两类内容正在成为标注治理的重点难点。

(1)AIGC内容:多模态混合下的识别复杂度上升

AI生成内容已从单一文本生成,扩展至图像、视频、多模态融合内容,在实际场景中呈现出以下特征:

● 内容拟真度高,难以直接识别

● 可能涉及敏感信息、虚假信息及侵权风险

基于传统规则或关键词的方式,已难以满足AI生成内容的稳定识别需求。

(2)营销信息:隐性表达导致语义识别难度提升

营销信息正在从显性广告形式,转向内容化表达方式,例如:

● 医疗、保健品、药品类软性推广内容

● 医美、整形等行业种草式内容

这类内容的典型特征是:表面为内容表达,本质为商业转化,这导致广告营销类标签在实际执行中难以准确判断。

2.存量内容治理难:规模化标注与补标压力较大

除新增内容外,短视频平台还面临着来自历史存量内容治理的难题:

● 历史内容规模大,覆盖范围广

● 缺乏统一标签体系,结构化程度低

● 人工补标成本高,效率难以支撑规模化需求

图片

数美标注能力体系

数美科技基于近十年在内容识别领域的积淀,建立了一套完备的内容标签体系,其核心功能主要体现在精细化的四级风险内容标签体系与全流程的存量内容治理能力两个维度:

1.四级风险内容标签体系

针对风险内容的海量样本库及平台面临的标注痛点,数美四级风险内容标签体系拥有足够细分的标签,能够更好地帮助机审优化迭代。同时,也有助于人工审核进行配合,对违规内容进行详细解释,帮助人工高效判断并处置,助力平台实现更全面更精细化的内容管理,提高审核效率。

图片

该标签体系覆盖文本、视觉、音频多模态内容,包括色情、暴恐、违禁等7大类标签共1800多个细化标签,将内容从“非结构化信息”映射为可计算对象:

● 一级:内容大类识别

● 二级/三级:对象与主题识别

● 四级:意图与行为维度识别

标签体系全面适配社交、电商、直播、教育、游戏、金融等多元业务场景,同时也能充分满足平台自身生态治理的需求。针对平台重点关注的风险内容识别,标签维度可实现多层级精细拆分。

图片

以广告素材标签为例,先划分通用行业广告素材大类,再逐层细分至具体内容形态,如“广告素材-通用行业广告素材-医疗保健药品-药品商品展示”。通过这种精细化的标签设计,平台能够快速精准研判内容导向,高效完成风险甄别与合规处置。

2.存量内容治理能力

在短视频内容治理新规下,存量内容治理已成为关键工程。面对数据体量庞大、合规时效紧迫等现实挑战,数美基于标注能力体系,支持历史数据批量回溯,能够高效满足特定时期监管要求的内容清洗需求,实现审核工作的可量化、可追溯。

3.  “机审+人审”协同标注

当下AIGC生成内容兼具复杂性与高仿真性,极易达到以假乱真的效果,不仅智能机器难以精准甄别,有时人力也无法有效分辨。针对AIGC等多个垂直行业场景,数美拥有专业化审核团队,提供覆盖文、图、视、听的多模态人机协同审核体系,同时适配多国语言。依托“机审+人审”双层联动,为全球客户提供专业化的服务,全面提升平台内容管理的科学性与合规性。

从“内容审核”到“内容标注”,AIGC时代的内容治理正在进入更加精细化、结构化的新阶段。未来,数美科技将不断完善标签体系与识别能力,结合监管政策与客户需求进化,以专业能力护航内容安全,为全球企业提供更高效、更精准的风险内容治理方案。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值