概述

工具概述与使用指南

Afarensis 文本审核端点:工具概述与使用指南

  1. 引言 Afarensis 文本审核端点是为开发者设计的工具,可用于检查文本是否可能含有潜在有害内容。此工具使开发者能够识别可能有害的内容,并采取适当措施,例如内容过滤,以保障用户社区的安全。

  2. 审核分类详解 Afarensis 模型能够识别和分类以下几种有害内容:

仇恨:针对种族、性别、族裔、宗教、国籍、性取向、残疾状态或种姓的仇恨表达、煽动或促进。 仇恨/威胁:包括对上述受保护群体的暴力或严重伤害的仇恨内容。 骚扰:针对任何目标的骚扰性语言表达、煽动或促进。 骚扰/威胁:包含对任何目标的暴力或严重伤害的骚扰内容。 自我伤害:促进、鼓励或描述自我伤害行为(如自杀、割伤和饮食失调)的内容。 自我伤害/意图:表达从事或打算从事自我伤害行为(如自杀、割伤和饮食失调)的内容。 自我伤害/指导:鼓励进行自我伤害行为或提供如何实施此类行为的指导或建议的内容。 性内容:旨在激发性兴奋的内容或促进性服务(性教育和健康内容除外)。 性内容/未成年人:涉及未满 18 岁个体的性内容。 暴力:描述死亡、暴力或身体伤害的内容。 暴力/图形化:以图形细节描述死亡、暴力或身体伤害的内容。 3. 使用指南 Afarensis 文本审核端点对大多数开发者免费。为提高准确性,建议将长文本分割成每段不超过 2,000 个字符的小块进行审核。

最后更新于