Gemini Omni まもなく登場詳しく見る
Gemini 3.5 Flash vs Gemini 3 Flash Preview:料金・コンテキスト・移行ガイド
比較

Gemini 3.5 Flash vs Gemini 3 Flash Preview:料金・コンテキスト・移行ガイド

EvoLink Team
EvoLink Team
Product Team
2026年5月20日
13 分
最終確認日:2026年5月20日。以下の料金および機能に関する情報は、同日に確認したGoogle公式モデルドキュメントおよびEvoLinkプラットフォームデータに基づいています。
GoogleのGemini Flashファミリーには、現在API経由で利用可能な2世代のモデルがあります:Gemini 3.5 Flash(安定版)とGemini 3 Flash Previewです。すでにGemini 3 Flash Previewを本番で運用しているチーム、あるいは新しいFlashモデルを検討しているチームにとって、答えは単に「新しい方が良い」ではありません。問うべきは:自分たちのワークロードに対して、機能向上が3倍の料金に見合うかどうかです。

まとめ

  • Gemini 3 Flash Preview$0.50/$3.00 / 1Mトークン(入力/出力)で、引き続き安価な選択肢です。コスト重視・大量処理で、Preview状態を許容できるワークロードに適しています。
  • Gemini 3.5 Flash$1.50/$9.00 / 1Mトークンですが、安定したGAモデルとして、推論・関数呼び出し・構造化出力が強化されており、エージェントワークフローに向いています。
  • 両モデルとも1Mトークンのコンテキストウィンドウと65,536トークンの出力上限を共有しています。
  • API上の移行はシンプルです(モデルIDの変更のみ)。ただしコストへの影響は大きいため、切り替え前に試算してください。

比較表

項目Gemini 3.5 FlashGemini 3 Flash Preview
Model IDgemini-3.5-flashgemini-3-flash-preview
ステータス安定版 (GA)Preview
入力料金$1.50 / 1M tokens$0.50 / 1M tokens
出力料金$9.00 / 1M tokens$3.00 / 1M tokens
キャッシュヒット料金$0.15 / 1M tokens$0.05 / 1M tokens
音声入力料金$1.50 / 1M tokens$1.00 / 1M tokens
コンテキストウィンドウ1,000,000 tokens1,048,576 tokens
出力上限65,536 tokens65,536 tokens
マルチモーダル入力Text, image, video, audio, PDFText, image, video, audio, PDF
関数呼び出しYesYes
構造化出力YesYes
コード実行YesYes
Context cachingYesYes
Batch APIYesYes
Google Search groundingYesYes
組み込み推論Yes(強化版)Yes

Gemini 3 Flash Previewを使い続けるべきケース

以下のような状況では、Gemini 3 Flash Previewが引き続き有力な選択肢です。

コストが最優先

入力$0.50、出力$3.00 / 1Mトークンで、Gemini 3 Flash PreviewはGemini 3.5 Flashの3分の1の料金です。分類、抽出、フォーマット変換、ルーティングなど、品質が既に十分な大量処理タスクでは、コスト差が急速に積み上がります。
例: 1日あたり10M入力トークン・2M出力トークンを処理するパイプライン:
モデル1日の入力コスト1日の出力コスト1日の合計月間合計
Gemini 3 Flash Preview$5.00$6.00$11.00$330
Gemini 3.5 Flash$15.00$18.00$33.00$990

1つのパイプラインだけで月額$660の差になります。

Previewステータスが許容できる

APIの動作が変わることがあっても問題ないワークロードで、すでにPreviewモデルの運用(バージョン固定、更新時のテストなど)に慣れているなら、Gemini 3 Flash Previewに留まることで不要な移行コストを避けられます。

現状の品質が合格基準を満たしている

既存のGemini 3 Flash Preview連携がスキーマ検証、事実精度、レイテンシ、リトライ率の基準をクリアしているなら、新しいモデルがあるという理由だけで移行する必要はありません。

Gemini 3.5 Flashに移行すべきケース

以下のような状況では、Gemini 3.5 Flashへの移行が合理的です。

GA水準の安定性が必要

Previewモデルはバージョン間で動作が変わる可能性があります。Gemini 3.5 FlashはGAモデルとしてリリースされており、予期せぬリグレッションを許容できない本番デプロイに適しています。

エージェントワークフローでより強い推論が求められる

Gemini 3.5 Flashには強化された組み込み推論機能があります。多段階の計画、ツール選択、複雑な関数呼び出しチェーンを含むエージェントのサブステップでは、推論の改善がリトライ率やフォールバック頻度を下げ、トークン単価の上昇を相殺できる場合があります。

構造化出力の信頼性が重要

パイプラインが厳格なスキーマ準拠(JSON mode、関数呼び出しレスポンス、型付き出力)に依存している場合、Gemini 3.5 Flashの改善された構造化出力により、バリデーション失敗や下流のエラーハンドリングを削減できます。

新規プロジェクトをゼロから構築する

既存のGemini 3 Flash Preview連携がない新規プロジェクトでは、最初からGemini 3.5 Flashを採用することで、将来廃止される可能性のあるPreviewモデル上に構築するリスクを回避できます。

移行チェックリスト

Gemini 3 Flash PreviewからGemini 3.5 Flashへの移行を決定した場合:

1. モデルIDを更新する

gemini-3-flash-preview → gemini-3.5-flash

EvoLinkの統合APIを利用している場合は、リクエスト内のmodelパラメータを変更するだけです。エンドポイントや認証の変更は不要です。

2. 予算を再試算する

現在のGemini 3 Flash Previewの支出を約3倍にして、Gemini 3.5 Flashのコストを見積もってください。推論の改善によりリトライ率が下がるワークロードでは、その分の節約も考慮に入れましょう。

3. 並行評価を実施する

本番トラフィックを切り替える前に、同じワークロードサンプルで両モデルを実行してください。比較項目:

  • タスク成功率
  • リトライ率
  • レイテンシ(最初のトークンまでの時間と完全な生成時間)
  • スキーマ妥当性
  • 成功タスクあたりのコスト

4. モニタリングとアラートを更新する

コストアラートと予算閾値を新しい料金体系に合わせて調整してください。

5. フォールバックを計画する

移行期間中はGemini 3 Flash Previewをフォールバックルートとして維持してください。Gemini 3.5 Flashでクォータ圧力やレイテンシスパイクが発生した場合、コード変更なしで切り戻せます。

成功タスクあたりのコスト:本当の比較軸

トークン単価はコストの一部に過ぎません。Gemini 3.5 Flashが自分のワークロードでリトライやフォールバックを減らし、初回成功率を上げるなら、実効コストの差は縮まります。

指標着目すべきポイント
リクエストあたりのトークンコスト直接的な料金差
リトライ率最初のレスポンスがバリデーションに失敗する頻度
フォールバック率Flashがより強力なモデルにエスカレートする頻度
レイテンシ最初のトークンまでの時間と完全な生成時間
タスク成功率初回で合格基準を満たす割合
成功タスクあたりのコストリトライ・フォールバック・無駄なトークンを含めた混合コスト

トークン単価が3倍でも初回で成功するモデルは、2〜3回のリトライが必要なモデルよりも安くなり得ます。

Gemini 3.1 Flash Lite Previewという選択肢

Gemini 3.5 Flashは高い、Gemini 3 Flash Previewは安定性が足りないという場合は、Gemini 3.1 Flash Lite Preview$0.25/$1.50 / 1Mトークン)も検討に値します。Gemini Flashファミリーで最も安価なオプションで、レイテンシとコストを最優先する大量・リトライ許容型のワークロード向けです。
モデル入力出力適したユースケース
Gemini 3.1 Flash Lite Preview$0.25$1.50最大ボリューム、コスト最優先
Gemini 3 Flash Preview$0.50$3.00コストと機能のバランス
Gemini 3.5 Flash$1.50$9.00GA安定性とエージェントワークフロー

FAQ

Gemini 3.5 FlashはGemini 3 Flash Previewの直接的な置き換えですか?

機能面ではその通りです。両モデルとも同じ入力モダリティ、関数呼び出し、構造化出力、context cachingに対応しています。ただし、Gemini 3.5 Flashはより高い料金帯のGAモデルであり、Gemini 3 Flash PreviewはPreview料金で引き続き利用可能です。

Gemini 3 Flash Previewは廃止されますか?

2026年5月20日時点で、GoogleはGemini 3 Flash Previewの廃止日を発表していません。ただし、Previewモデルは一般的に安定版に置き換えられていく傾向があります。Gemini APIリリースノートで廃止アナウンスを確認してください。

EvoLink経由で両モデルを利用できますか?

はい。EvoLinkの統合APIは両方のモデルIDに対応しています。コスト、品質、レイテンシの要件に応じて異なるワークロードを異なるモデルにルーティングでき、個別のプロバイダー統合を管理する必要はありません。

3倍の料金アップは妥当ですか?

ワークロードによります。大量・コスト重視で、Gemini 3 Flash Previewの品質が既に十分なタスクでは、アップグレードは正当化されないかもしれません。エージェントワークフロー、構造化出力パイプライン、GA安定性が必要な本番システムでは、推論と信頼性の向上がコスト増を相殺できます。

移行前にどうテストすればよいですか?

本番ワークロードの代表的なサンプルで両モデルを実行してください。タスク成功率、リトライ率、レイテンシ、成功タスクあたりのコストを比較しましょう。「新しいモデルは全般的に優れている」という想定ではなく、実測データに基づいて判断してください。

EvoLinkでGemini Flashモデルを比較する

EvoLinkはGemini 3.5 FlashとGemini 3 Flash Previewの両方にアクセスできる統合APIを提供しています。1つの統合でルーティング、フォールバック動作、ワークロードレベルのコストをテストできます。

関連記事:

EvoLinkで探す:

ソース

AIコストを89%削減する準備はできましたか?

今すぐEvoLinkを始めて、インテリジェントなAPIルーティングの力を体験してください。