HappyHorse 1.0 リリース今すぐ試す

EvoLink Moderation 1.0 API

EvoLink Moderation 1.0 はテキストと画像を 13 種類の有害カテゴリに分類し、調整済みのリスクレベルを返すマルチモーダルなコンテンツ安全モデルです。OpenAI /v1/moderations エンドポイントと 100% 互換。EvoLink がチューニングした閾値と明快な summary フィールドで、本番運用にそのまま投入できます。
モデルタイプ:

99.9% の稼働率を保証する最も安定した構成で、本番環境に推奨されます。

すべてのバージョンで同じ API エンドポイントを使用し、異なるのは model パラメータのみです。

料金

コール課金

USD

1 コールあたり

クレジット

1 コールあたり

課金ルール

  • 1 コールあたり 1 クレジット固定 — トークン課金なし、ボリュームディスカウントもなし。
  • 入力の長さや画像の有無にかかわらず料金は同じ。
  • 各レスポンスには標準のモデレーションフィールドに加え、risk_level と violations を集約した evolink_summary ブロックが含まれます。
  • 失敗したリクエスト(4xx/5xx)は課金されません。

リスク等級のしきい値

EvoLink はカテゴリ別のしきい値を適用して risk_level を計算します。いずれかのカテゴリが high しきい値以上になると risk_level = high、flagged = true となります。

カテゴリMediumHigh感度
sexual/minors0.050.20レッドライン — 絶対不許容
self-harm0.300.60厳格 — 漏れを許さない
self-harm/intent0.300.60厳格 — 漏れを許さない
self-harm/instructions0.300.60厳格 — 漏れを許さない
violence/graphic0.400.70厳格 — 漏れを許さない
illicit/violent0.400.70厳格 — 漏れを許さない
sexual0.500.80標準
violence0.500.80標準
harassment/threatening0.500.80標準
hate/threatening0.500.80標準
harassment0.600.85緩和 — 誤検知を減らす
hate0.600.85緩和 — 誤検知を減らす
illicit0.600.85緩和 — 誤検知を減らす

しきい値はバージョンに応じて変わる場合があります。本番値は API が返す結果が真実の出典です。

本番運用に対応したコンテンツモデレーション

EvoLink Moderation 1.0 はテキストと画像に対し、決定論的な安全分類を提供します。1 リクエストごとに 13 個のカテゴリスコアと、リスクレベル・違反・主要カテゴリを示す EvoLink summary を返却。複雑な出力を解析する代わりに、単一フィールドで判断できます。

EvoLink Moderation 1.0 API ヒーローイメージ

EvoLink Moderation 1.0 で何ができる?

ユーザー生成コンテンツの安全性

SNS、フォーラム、コミュニティアプリで攻撃的なコメント、投稿、アップロードをフィルタリング。ハラスメント、ヘイトスピーチ、露骨なコンテンツがユーザーに届く前にブロックします。

UGC モデレーションのユースケース

AI 出力のガードレール

チャットボット、コパイロット、生成パイプラインにセーフティチェックを追加。配信前にプロンプトと出力を EvoLink Moderation に通し、ポリシー違反の応答を予測可能なレイテンシでブロックします。

AI ガードレールのユースケース

コンプライアンスと信頼ワークフロー

構造化された違反ラベルでモデレーションキュー、KYC レビュー、コンプライアンスフローを駆動。risk_level summary は 許可 / レビュー / ブロック の判断にそのまま対応します。

コンプライアンスワークフロー

なぜチームは EvoLink Moderation 1.0 を選ぶのか

EvoLink Moderation 1.0 は、決定論的なリスクレベル、多言語対応、OpenAI 互換のラインを備えた本番運用可能なマルチモーダル安全レイヤーです。

13 種類の有害カテゴリ

ハラスメント、ヘイト、性的、暴力、自傷、違法行為、未成年保護違反をカテゴリごとの信頼度スコアと共に検出します。

マルチモーダル入力

テキストのみ、単一画像のみ、またはテキスト+画像 1 枚を同一リクエストで送信可能。画像カテゴリは sexual、violence、self-harm をカバー。

決定論的リスクレベル

各レスポンスに evolink_summary が含まれ、risk_level(low / medium / high)、violations 配列、最高スコアのカテゴリを返します。

予測可能な料金

1 リクエストあたり 1 クレジットの per-call 課金。トークン計算もストリーミングのサプライズもなし — 予算が許す限り審査できます。

EvoLink Moderation 1.0 を統合する方法

EvoLink Moderation は OpenAI /v1/moderations エンドポイントと完全互換。base URL を変更し model: evolink-moderation-1.0 を渡すだけ。

1

ステップ 1 — 認証

EvoLink API キーを作成し、Bearer トークン認証で /v1/moderations を呼び出します。

2

ステップ 2 — 入力を送信

model: evolink-moderation-1.0 と、text 要素、image_url 要素、もしくはその両方を含む input 配列を渡します。1 リクエストにつき画像 1 枚まで。

3

ステップ 3 — evolink_summary を読む

evolink_summary.risk_level(low/medium/high)と violations[] を使い、許可 / レビュー / ブロック の判断を 1 つの分岐で完結させます。

EvoLink Moderation 1.0 の主な機能

EvoLink がチューニングした、本番運用向けの閾値

エンジン

本番運用級のセーフティエンジン

最先端のマルチモーダル安全分類器。EvoLink が実運用のモデレーション負荷に合わせてカテゴリ別の閾値を校正済み。

校正

カテゴリ別の閾値

sexual/minors と self-harm には厳格な閾値、harassment と hate には誤検知を減らす緩めの閾値を採用。

スキーマ

EvoLink Summary フィールド

evolink_summary オブジェクト 1 つに risk_level、flagged、violations、max_score、max_category を集約。標準のモデレーションフィールドも併せて返却。

マルチモーダル

テキスト + 画像 1 枚

1 回の同期呼び出しでマルチモーダル評価。画像入力は sexual、violence、self-harm カテゴリをカバー。

互換性

OpenAI SDK 互換

OpenAI SDK でそのまま動作。base_url を切り替え、model を evolink-moderation-1.0 にするだけ — コード書き換え不要。

言語

多言語検出

英語、中国語、スペイン語、日本語など 40 以上の言語にわたって強力なマルチモーダル検出をカバー。

EvoLink Moderation 1.0 よくある質問

Everything you need to know about the product and billing.

EvoLink Moderation 1.0 はマルチモーダルなコンテンツ安全分類器で、リスク等級のしきい値を本番向けに調整しています。各レスポンスは標準のモデレーションフィールドに加え、調整済みの risk_level(low/medium/high)と違反を引き起こしたカテゴリを含む evolink_summary フィールドを返却 — 13 個の生スコアを 1 つの判断にまとめます。
13 カテゴリ:harassment、harassment/threatening、hate、hate/threatening、illicit、illicit/violent、self-harm、self-harm/intent、self-harm/instructions、sexual、sexual/minors、violence、violence/graphic。画像入力は sexual、violence、self-harm、violence/graphic をカバーします。
送れません。各リクエストはテキスト+ image_url 1 枚をサポートします。複数画像をモデレーションするには、画像ごとに並列リクエストを送り、アプリ側で結果を集約してください。
EvoLink は本番向けに調整したカテゴリ別の閾値を適用します。sexual/minors と self-harm は厳格な値(high が 0.20 / 0.60)、violence/graphic は 0.70、harassment/hate は 0.85。high 閾値以上のカテゴリがあれば risk_level = high、flagged = true を返します。
全ユーザーグループ共通で 1 コール 1 クレジット(10,000 UC)。トークン課金ではなく per-call なので、入力サイズに関係なくコストが完全に予測可能です。
はい。エンドポイントは /v1/moderations と同じリクエストスキーマを受け付けます。base_url を EvoLink エンドポイントに、model を evolink-moderation-1.0 に設定するだけで、OpenAI SDK は無修正で動作します — 標準レスポンスに evolink_summary フィールドが追加されます。