Gemini Omni まもなく登場詳しく見る

Gemini 3.1 Pro Preview API

EvoLink ? Gemini 3.1 Pro Preview ?????????????????????????????????????1M context?Thinking mode?CustomTools ?????????????
モデルタイプ:
価格: 

$1.865 - 3.729(~ 126.8 - 253.6 credits) per 1M input tokens; $11.182 - 16.774(~ 760.4 - 1140.6 credits) per 1M output tokens

$0.187 - 0.374(~ 12.7 - 25.4 credits) per 1M cache read tokens

Google Search grounding charged separately per query.

99.9% の稼働率を保証する最も安定した構成で、本番環境に推奨されます。

すべてのバージョンで同じ API エンドポイントを使用し、異なるのは model パラメータのみです。

Gemini 3.1 Pro ? Gemini ?? API ???

Gemini 3.1 Pro ? EvoLink ???????????? Gemini ??????1M tokens ????? $2 / ?? $12?OpenAI SDK ???Thinking mode?tool use ???????

example 1

Gemini 3.1 Pro が Google のトップモデルである理由

フロンティアのコーディング & 推論

Gemini 3.1 Pro はコーディングタスクにおける Google のトップティアモデルです。SWE-bench や HumanEval などの公開ベンチマークで Claude Opus 4.6 や GPT 5.4 と競合する性能を発揮しています。

example 2

エージェントワークフロー & CustomTools

Thinking モード、Function calling、構造化出力、ツール集約型パイプライン向けの専用 CustomTools バリアント(gemini-3.1-pro-customtools)によるマルチステップエージェントループ向けに設計されています。

example 3

1M コンテキスト + 本番向けコントロール

コードベース全体、長文ドキュメント、マルチターン会話を 1 リクエストで処理可能。キャッシュ、Batch API、Google 検索グラウンディングで本番スケールのデプロイメントに対応します。

example 4

EvoLink で Gemini 3.1 Pro を選ぶ理由

Gemini 3.1 Pro は同等モデルより低い価格帯で優れた推論性能を提供し、EvoLink は OpenAI SDK 互換、使用量追跡、統一請求を追加します。

最高のコストパフォーマンス

1M トークンあたり $2/$12 で、Claude Opus 4.6($15/$75)を大幅に下回る料金です。具体的なタスクでのパフォーマンスデータはベンチマーク比較をご確認ください。

OpenAI からのドロップイン置き換え

同じ /v1/chat/completions 形式と OpenAI SDK を使用。GPT モデルからの切り替えはモデル文字列と API ベース URL の変更のみで完了します。

完全な使用量の透明性

すべてのレスポンスに prompt_tokens、completion_tokens、reasoning_tokens、キャッシュ使用状況が含まれます。リクエストごとのコストと推論の深さをトークンレベルで追跡できます。

Gemini 3.1 Pro Preview の呼び出し方法

OpenAI SDK 形式と gemini-3.1-pro-preview モデル文字列を使用します。

1

ステップ 1 - モデルを設定

リクエストボディで model: "gemini-3.1-pro-preview" を使用します。

2

ステップ 2 - メッセージを送信

role/content ペア(最小長 1)を含む messages 配列を提供します。

3

ステップ 3 - 出力と使用状況を確認

choices[0].message.content を読み、usage.prompt_tokens、completion_tokens、reasoning_tokens を追跡します。

Gemini 3.1 Pro Preview スペック

Google フラッグシップ推論モデルの技術詳細

モデル

モデル ID

gemini-3.1-pro-preview(汎用)または gemini-3.1-pro-customtools(ツール集約型ワークロード)。

料金

入力料金

1M トークンあたり $2.00(標準)、200K トークン超のプロンプトは $4.00。

料金

出力料金

1M トークンあたり $12.00(標準)、200K トークン超の大量プロンプトは $18.00。

制限

コンテキストウィンドウ

1,000,000 入力トークン(1M コンテキスト)。最大出力: 65,536 トークン。

マルチモーダル

対応入力

テキスト、コード、画像、動画、音声、PDF。出力はテキストのみ。Google 検索グラウンディング + URL コンテキスト対応。

ライフサイクル

3.0 Pro からのアップグレード

コーディングベンチマーク、指示追従、エージェントのツール使用が初代 Gemini 3 Pro Preview から向上しています。

Gemini 3.1 Pro API FAQ

Everything you need to know about the product and billing.

Gemini 3.1 Pro はコーディングと推論のベンチマークで競合する性能を発揮しています。最大の強みは料金です。1M トークンあたり $2/$12 で、Claude Opus 4.6($15/$75)や GPT 5.4 を大幅に下回ります。タスク別の詳細なパフォーマンスデータはベンチマーク比較をご覧ください。
Google はコーディングベンチマークスコア、指示追従精度、エージェントのツール使用の信頼性、レスポンスの一貫性を改善しました。ツール集約型ワークフロー向けの専用 CustomTools バリアントも追加されました。1M コンテキストウィンドウと料金は両方とも同一です。
gemini-3.1-pro-customtools は、EvoLink 上で Function calling、tools 配列、マルチステップエージェントループに依存するリクエスト向けに最適化された独立ルートです。ベースルートと同一料金です。汎用推論にはベースの gemini-3.1-pro-preview を使用してください。
Standard: $2.00 input / $12.00 output per 1M tokens. Check the EvoLink dashboard and official Gemini pricing docs for current grounding and tool charges.
model の値として "gemini-3.1-pro-preview" を使用します。ツール集約型ワークロードの場合は "gemini-3.1-pro-customtools" を使用してください。どちらも api.evolink.ai/v1/chat/completions に Bearer token 認証でリクエストを送信します。
はい。Thinking モードにより複雑なタスクのチェーンオブソート推論が可能です。推論トークンは completion_tokens_details.reasoning_tokens で個別に追跡されるため、推論の深さとコストを監視できます。
1,000,000 入力トークン(1M コンテキスト)、最大出力トークンは 65,536。キャッシュ(暗黙的 + 明示的)と Batch API によるロングコンテキストパイプラインに対応しています。
はい。EvoLink のエンドポイントは完全に OpenAI SDK 互換です。標準の model + messages 形式で /v1/chat/completions を使用します。モデル文字列とベース URL を変更するだけで、他の OpenAI モデルからコード変更なしで切り替えられます。
Wait 5-10 minutes and retry. For production reliability, use the recommended preview route for your workload and keep a fallback model configured.

Gemini 3.1 Pro の Gemini ファミリーでの位置づけ

Gemini 3.1 Pro は Google の現行フラッグシップ推論モデルです。ツール多用のエージェントワークフローには CustomTools、低コストタスクには Flash、競合比較には GPT 5.4 や Claude Opus 4.6 をご検討ください。 Gemini ファミリーを確認するか、比較ガイドを読んで最適なモデルを選びましょう。