EvoLink Moderation 1.0 API

EvoLink Moderation 1.0 はテキストと画像を 13 種類の有害カテゴリに分類し、調整済みのリスクレベルを返すマルチモーダルなコンテンツ安全モデルです。OpenAI /v1/moderations エンドポイントと 100% 互換。EvoLink がチューニングした閾値と明快な summary フィールドで、本番運用にそのまま投入できます。

モデルタイプ:

本番ワークロード向けの安定したマネージドアクセスです。ダッシュボード請求、API キー管理、予測しやすい統合動作が必要な場合に適しています。

すべてのバージョンで同じ API エンドポイントを使用し、異なるのは model パラメータのみです。

料金

コール課金

USD

1 コールあたり

クレジット

1 コールあたり

課金ルール

•1 コールあたり 1 クレジット固定 — トークン課金なし、ボリュームディスカウントもなし。
•入力の長さや画像の有無にかかわらず料金は同じ。
•各レスポンスには標準のモデレーションフィールドに加え、risk_level と violations を集約した evolink_summary ブロックが含まれます。
•失敗したリクエスト（4xx/5xx）は課金されません。

リスク等級のしきい値

EvoLink はカテゴリ別のしきい値を適用して risk_level を計算します。いずれかのカテゴリが high しきい値以上になると risk_level = high、flagged = true となります。

カテゴリ	Medium	High	感度
sexual/minors	0.05	0.20	レッドライン — 絶対不許容
self-harm	0.30	0.60	厳格 — 漏れを許さない
self-harm/intent	0.30	0.60	厳格 — 漏れを許さない
self-harm/instructions	0.30	0.60	厳格 — 漏れを許さない
violence/graphic	0.40	0.70	厳格 — 漏れを許さない
illicit/violent	0.40	0.70	厳格 — 漏れを許さない
sexual	0.50	0.80	標準
violence	0.50	0.80	標準
harassment/threatening	0.50	0.80	標準
hate/threatening	0.50	0.80	標準
harassment	0.60	0.85	緩和 — 誤検知を減らす
hate	0.60	0.85	緩和 — 誤検知を減らす
illicit	0.60	0.85	緩和 — 誤検知を減らす

しきい値はバージョンに応じて変わる場合があります。本番値は API が返す結果が真実の出典です。

本番運用に対応したコンテンツモデレーション

EvoLink Moderation 1.0 はテキストと画像に対し、決定論的な安全分類を提供します。1 リクエストごとに 13 個のカテゴリスコアと、リスクレベル・違反・主要カテゴリを示す EvoLink summary を返却。複雑な出力を解析する代わりに、単一フィールドで判断できます。

EvoLink Moderation 1.0 で何ができる？

ユーザー生成コンテンツの安全性

SNS、フォーラム、コミュニティアプリで攻撃的なコメント、投稿、アップロードをフィルタリング。ハラスメント、ヘイトスピーチ、露骨なコンテンツがユーザーに届く前にブロックします。

フィルタリングを開始

AI 出力のガードレール

チャットボット、コパイロット、生成パイプラインにセーフティチェックを追加。配信前にプロンプトと出力を EvoLink Moderation に通し、ポリシー違反の応答を予測可能なレイテンシでブロックします。

ガードレールを追加

コンプライアンスと信頼ワークフロー

構造化された違反ラベルでモデレーションキュー、KYC レビュー、コンプライアンスフローを駆動。risk_level summary は許可 / レビュー / ブロックの判断にそのまま対応します。

ワークフローを構築

なぜチームは EvoLink Moderation 1.0 を選ぶのか

EvoLink Moderation 1.0 は、決定論的なリスクレベル、多言語対応、OpenAI 互換のラインを備えた本番運用可能なマルチモーダル安全レイヤーです。

13 種類の有害カテゴリ

ハラスメント、ヘイト、性的、暴力、自傷、違法行為、未成年保護違反をカテゴリごとの信頼度スコアと共に検出します。

マルチモーダル入力

テキストのみ、単一画像のみ、またはテキスト＋画像 1 枚を同一リクエストで送信可能。画像カテゴリは sexual、violence、self-harm をカバー。

決定論的リスクレベル

各レスポンスに evolink_summary が含まれ、risk_level（low / medium / high）、violations 配列、最高スコアのカテゴリを返します。

予測可能な料金

1 リクエストあたり 1 クレジットの per-call 課金。トークン計算もストリーミングのサプライズもなし — 予算が許す限り審査できます。

EvoLink Moderation 1.0 を統合する方法

EvoLink Moderation は OpenAI /v1/moderations エンドポイントと完全互換。base URL を変更し model: evolink-moderation-1.0 を渡すだけ。

ステップ 1 — 認証

EvoLink API キーを作成し、Bearer トークン認証で /v1/moderations を呼び出します。

ステップ 2 — 入力を送信

model: evolink-moderation-1.0 と、text 要素、image_url 要素、もしくはその両方を含む input 配列を渡します。1 リクエストにつき画像 1 枚まで。

ステップ 3 — evolink_summary を読む

evolink_summary.risk_level（low/medium/high）と violations[] を使い、許可 / レビュー / ブロックの判断を 1 つの分岐で完結させます。

EvoLink Moderation 1.0 の主な機能

EvoLink がチューニングした、本番運用向けの閾値

エンジン

本番運用級のセーフティエンジン

最先端のマルチモーダル安全分類器。EvoLink が実運用のモデレーション負荷に合わせてカテゴリ別の閾値を校正済み。

校正

カテゴリ別の閾値

sexual/minors と self-harm には厳格な閾値、harassment と hate には誤検知を減らす緩めの閾値を採用。

スキーマ

EvoLink Summary フィールド

evolink_summary オブジェクト 1 つに risk_level、flagged、violations、max_score、max_category を集約。標準のモデレーションフィールドも併せて返却。

マルチモーダル

テキスト + 画像 1 枚

1 回の同期呼び出しでマルチモーダル評価。画像入力は sexual、violence、self-harm カテゴリをカバー。

互換性

OpenAI SDK 互換

OpenAI SDK でそのまま動作。base_url を切り替え、model を evolink-moderation-1.0 にするだけ — コード書き換え不要。

言語

多言語検出

英語、中国語、スペイン語、日本語など 40 以上の言語にわたって強力なマルチモーダル検出をカバー。

EvoLink Moderation 1.0 よくある質問

Everything you need to know about the product and billing.

EvoLink Moderation 1.0 はマルチモーダルなコンテンツ安全分類器で、リスク等級のしきい値を本番向けに調整しています。各レスポンスは標準のモデレーションフィールドに加え、調整済みの risk_level（low/medium/high）と違反を引き起こしたカテゴリを含む evolink_summary フィールドを返却 — 13 個の生スコアを 1 つの判断にまとめます。

13 カテゴリ：harassment、harassment/threatening、hate、hate/threatening、illicit、illicit/violent、self-harm、self-harm/intent、self-harm/instructions、sexual、sexual/minors、violence、violence/graphic。画像入力は sexual、violence、self-harm、violence/graphic をカバーします。

送れません。各リクエストはテキスト＋ image_url 1 枚をサポートします。複数画像をモデレーションするには、画像ごとに並列リクエストを送り、アプリ側で結果を集約してください。

EvoLink は本番向けに調整したカテゴリ別の閾値を適用します。sexual/minors と self-harm は厳格な値（high が 0.20 / 0.60）、violence/graphic は 0.70、harassment/hate は 0.85。high 閾値以上のカテゴリがあれば risk_level = high、flagged = true を返します。

全ユーザーグループ共通で 1 コール 1 クレジット（10,000 UC）。トークン課金ではなく per-call なので、入力サイズに関係なくコストが完全に予測可能です。

はい。エンドポイントは /v1/moderations と同じリクエストスキーマを受け付けます。base_url を EvoLink エンドポイントに、model を evolink-moderation-1.0 に設定するだけで、OpenAI SDK は無修正で動作します — 標準レスポンスに evolink_summary フィールドが追加されます。