HappyHorse 1.0 正式上线立即体验

EvoLink Moderation 1.0 API

EvoLink Moderation 1.0 是一款多模态内容安全模型,能将文本和图像分类到 13 个违规类别,并给出经过校准的风险等级。100% 兼容 OpenAI /v1/moderations 端点,附带 EvoLink 优化的阈值和清晰的 summary 字段,可直接用于生产环境。

稳定性最高,保证 99.9% 可用性。推荐用于生产环境。

所有版本使用同一个 API 端点,仅 model 参数不同。

定价

按次计费

美元

每次调用

积分

每次调用

计费规则

  • 按次 1 积分——无 token 计费,无量级阶梯。
  • 费用与输入长度或是否包含图片无关。
  • 每次响应都附带标准审核字段 + evolink_summary 块,给出 risk_level 与 violations 的一行决策。
  • 失败的请求(4xx/5xx)不计费。

风险等级阈值

EvoLink 按类别应用不同阈值计算 risk_level。任意类别达到或超过 high 阈值时,risk_level 为 high,flagged 为 true。

类别MediumHigh敏感度
sexual/minors0.050.20红线——零容忍
self-harm0.300.60严格——低漏报倾向
self-harm/intent0.300.60严格——低漏报倾向
self-harm/instructions0.300.60严格——低漏报倾向
violence/graphic0.400.70严格——低漏报倾向
illicit/violent0.400.70严格——低漏报倾向
sexual0.500.80标准
violence0.500.80标准
harassment/threatening0.500.80标准
hate/threatening0.500.80标准
harassment0.600.85宽松——减少误报
hate0.600.85宽松——减少误报
illicit0.600.85宽松——减少误报

阈值会随版本演进。当前生产值以 API 实际计算结果为准。

可投产的内容审核服务

EvoLink Moderation 1.0 为文本和图像提供确定性的安全分类。每次请求返回 13 个类别分数,外加一个 EvoLink summary,包含风险等级、违规项和主导类别——你的应用只需读一个字段就能决策,不必解析复杂结果。

EvoLink Moderation 1.0 API 功能展示

使用 EvoLink Moderation 1.0 可以做什么?

用户生成内容(UGC)安全

在社交平台、论坛和社区应用中过滤冒犯性的评论、帖子和上传内容。在骚扰、仇恨言论和色情内容触达用户之前拦截它们。

UGC 审核场景

AI 输出护栏

在你的聊天机器人、副驾驶或生成式管线外加一层安全检查。在交付前对 prompt 和输出运行 EvoLink Moderation,以可预测的延迟拦截违规响应。

AI 护栏场景

合规与可信工作流

用结构化的违规标签驱动审核队列、KYC 复核和内容合规工作流。risk_level summary 可直接映射到放行 / 复核 / 拦截的决策。

合规工作流场景

团队为什么选择 EvoLink Moderation 1.0

EvoLink Moderation 1.0 是一层可投产的多模态安全模型,提供确定性的风险等级、多语言支持,以及与 OpenAI 协议完全兼容的接入方式。

13 个违规类别

检测骚扰、仇恨、色情、暴力、自残、非法内容和未成年人安全违规,并给出每个类别的置信度分数。

多模态输入

可以单独发送文本、单独发送一张图片,或在同一请求中发送文本加一张图片。图像类别覆盖色情、暴力和自残。

确定性的风险等级

每次响应都包含 evolink_summary,给出 low / medium / high 的 risk_level、violations 数组和最高分类别。

可预测的定价

按次计费,每次 1 积分。没有 token 计算,没有流式扣费意外——预算允许多少就审核多少。

如何集成 EvoLink Moderation 1.0

EvoLink Moderation 完全兼容 OpenAI /v1/moderations 端点。只需更改 base URL 并传入 model: evolink-moderation-1.0。

1

第 1 步 — 身份验证

创建 EvoLink API 密钥,使用 Bearer token 调用 /v1/moderations。

2

第 2 步 — 发送 input

传入 model: evolink-moderation-1.0 和包含 text、image_url 或两者的 input 数组。每次请求最多一张图。

3

第 3 步 — 读取 evolink_summary

使用 evolink_summary.risk_level(low/medium/high)和 violations[] 在一个分支里完成放行 / 复核 / 拦截的决策。

EvoLink Moderation 1.0 核心能力

EvoLink 为生产环境调校的阈值与摘要

引擎

生产级安全引擎

前沿多模态安全分类器,由 EvoLink 按类别校准阈值,针对真实生产场景的内容审核负载进行优化。

校准

分类别阈值

对 sexual/minors 和 self-harm 采用严格阈值,对 harassment 和 hate 放宽阈值以减少误伤。

Schema

EvoLink Summary 字段

单个 evolink_summary 对象,包含 risk_level、flagged、violations、max_score、max_category——同时保留标准审核字段供深度使用者参考。

多模态

文本 + 单张图片

在同一个同步请求里完成多模态评估。图片输入覆盖色情、暴力和自残类别。

兼容性

兼容 OpenAI SDK

直接使用 OpenAI SDK:切换 base_url,把 model 设为 evolink-moderation-1.0——无需重写代码。

语言

多语言检测

在 40+ 种语言(英文、中文、西班牙语、日语等)上具备强大的多模态检测覆盖。

EvoLink Moderation 1.0 常见问题

Everything you need to know about the product and billing.

EvoLink Moderation 1.0 是一款多模态内容安全分类器,附带经过校准的风险等级阈值。每次响应都包含标准审核字段,再加上一个 evolink_summary 字段,给出 risk_level(low/medium/high)和触发违规的类别——把 13 个原始分数浓缩成单个决策。
13 个类别:harassment、harassment/threatening、hate、hate/threatening、illicit、illicit/violent、self-harm、self-harm/intent、self-harm/instructions、sexual、sexual/minors、violence、violence/graphic。图像输入覆盖 sexual、violence、self-harm 和 violence/graphic。
不可以。每次请求支持文本加一张 image_url。如需审核多张图片,请并发发送多次请求——每张图一次——然后在你的应用里聚合结果。
EvoLink 使用为生产场景调校的分类别阈值。sexual/minors 和 self-harm 采用严格阈值(high 分别为 0.20 / 0.60),violence/graphic 为 0.70,harassment/hate 为 0.85。任意类别达到或超过 high 阈值,risk_level 即为 high,flagged 为 true。
所有用户组统一每次 1 积分(10,000 UC)。按次计费而非按 token,无论输入大小成本都完全可预测。
兼容。本端点接受与 /v1/moderations 完全相同的请求结构。把 base_url 设为 EvoLink 端点,model 设为 evolink-moderation-1.0,OpenAI SDK 无需任何修改即可使用——evolink_summary 字段会与标准响应一并返回。