比較

Gemini 3.5 Flash vs Gemini 3 Flash Preview：料金・コンテキスト・移行ガイド

Name: EvoLink AI API Gateway
Brand: EvoLink
Availability: InStock

EvoLink Team

Product Team

2026年5月20日

13 分

最終確認日：2026年5月20日。以下の料金および機能に関する情報は、同日に確認したGoogle公式モデルドキュメントおよびEvoLinkプラットフォームデータに基づいています。

GoogleのGemini Flashファミリーには、現在API経由で利用可能な2世代のモデルがあります：Gemini 3.5 Flash（安定版）とGemini 3 Flash Previewです。すでにGemini 3 Flash Previewを本番で運用しているチーム、あるいは新しいFlashモデルを検討しているチームにとって、答えは単に「新しい方が良い」ではありません。問うべきは：自分たちのワークロードに対して、機能向上が3倍の料金に見合うかどうかです。

まとめ

Gemini 3 Flash Previewは$0.50/$3.00 / 1Mトークン（入力/出力）で、引き続き安価な選択肢です。コスト重視・大量処理で、Preview状態を許容できるワークロードに適しています。
Gemini 3.5 Flashは$1.50/$9.00 / 1Mトークンですが、安定したGAモデルとして、推論・関数呼び出し・構造化出力が強化されており、エージェントワークフローに向いています。
両モデルとも1Mトークンのコンテキストウィンドウと65,536トークンの出力上限を共有しています。
API上の移行はシンプルです（モデルIDの変更のみ）。ただしコストへの影響は大きいため、切り替え前に試算してください。

比較表

項目	Gemini 3.5 Flash	Gemini 3 Flash Preview
Model ID	`gemini-3.5-flash`	`gemini-3-flash-preview`
ステータス	安定版 (GA)	Preview
入力料金	$1.50 / 1M tokens	$0.50 / 1M tokens
出力料金	$9.00 / 1M tokens	$3.00 / 1M tokens
キャッシュヒット料金	$0.15 / 1M tokens	$0.05 / 1M tokens
音声入力料金	$1.50 / 1M tokens	$1.00 / 1M tokens
コンテキストウィンドウ	1,000,000 tokens	1,048,576 tokens
出力上限	65,536 tokens	65,536 tokens
マルチモーダル入力	Text, image, video, audio, PDF	Text, image, video, audio, PDF
関数呼び出し	Yes	Yes
構造化出力	Yes	Yes
コード実行	Yes	Yes
Context caching	Yes	Yes
Batch API	Yes	Yes
Google Search grounding	Yes	Yes
組み込み推論	Yes（強化版）	Yes

Gemini 3 Flash Previewを使い続けるべきケース

以下のような状況では、Gemini 3 Flash Previewが引き続き有力な選択肢です。

コストが最優先

入力$0.50、出力$3.00 / 1Mトークンで、Gemini 3 Flash PreviewはGemini 3.5 Flashの3分の1の料金です。分類、抽出、フォーマット変換、ルーティングなど、品質が既に十分な大量処理タスクでは、コスト差が急速に積み上がります。

例： 1日あたり10M入力トークン・2M出力トークンを処理するパイプライン：

モデル	1日の入力コスト	1日の出力コスト	1日の合計	月間合計
Gemini 3 Flash Preview	$5.00	$6.00	$11.00	$330
Gemini 3.5 Flash	$15.00	$18.00	$33.00	$990

1つのパイプラインだけで月額$660の差になります。

Previewステータスが許容できる

APIの動作が変わることがあっても問題ないワークロードで、すでにPreviewモデルの運用（バージョン固定、更新時のテストなど）に慣れているなら、Gemini 3 Flash Previewに留まることで不要な移行コストを避けられます。

現状の品質が合格基準を満たしている

既存のGemini 3 Flash Preview連携がスキーマ検証、事実精度、レイテンシ、リトライ率の基準をクリアしているなら、新しいモデルがあるという理由だけで移行する必要はありません。

Gemini 3.5 Flashに移行すべきケース

以下のような状況では、Gemini 3.5 Flashへの移行が合理的です。

GA水準の安定性が必要

Previewモデルはバージョン間で動作が変わる可能性があります。Gemini 3.5 FlashはGAモデルとしてリリースされており、予期せぬリグレッションを許容できない本番デプロイに適しています。

エージェントワークフローでより強い推論が求められる

Gemini 3.5 Flashには強化された組み込み推論機能があります。多段階の計画、ツール選択、複雑な関数呼び出しチェーンを含むエージェントのサブステップでは、推論の改善がリトライ率やフォールバック頻度を下げ、トークン単価の上昇を相殺できる場合があります。

構造化出力の信頼性が重要

パイプラインが厳格なスキーマ準拠（JSON mode、関数呼び出しレスポンス、型付き出力）に依存している場合、Gemini 3.5 Flashの改善された構造化出力により、バリデーション失敗や下流のエラーハンドリングを削減できます。

新規プロジェクトをゼロから構築する

既存のGemini 3 Flash Preview連携がない新規プロジェクトでは、最初からGemini 3.5 Flashを採用することで、将来廃止される可能性のあるPreviewモデル上に構築するリスクを回避できます。

移行チェックリスト

Gemini 3 Flash PreviewからGemini 3.5 Flashへの移行を決定した場合：

1. モデルIDを更新する

gemini-3-flash-preview → gemini-3.5-flash

EvoLinkの統合APIを利用している場合は、リクエスト内のmodelパラメータを変更するだけです。エンドポイントや認証の変更は不要です。

2. 予算を再試算する

現在のGemini 3 Flash Previewの支出を約3倍にして、Gemini 3.5 Flashのコストを見積もってください。推論の改善によりリトライ率が下がるワークロードでは、その分の節約も考慮に入れましょう。

3. 並行評価を実施する

本番トラフィックを切り替える前に、同じワークロードサンプルで両モデルを実行してください。比較項目：

タスク成功率
リトライ率
レイテンシ（最初のトークンまでの時間と完全な生成時間）
スキーマ妥当性
成功タスクあたりのコスト

4. モニタリングとアラートを更新する

コストアラートと予算閾値を新しい料金体系に合わせて調整してください。

5. フォールバックを計画する

移行期間中はGemini 3 Flash Previewをフォールバックルートとして維持してください。Gemini 3.5 Flashでクォータ圧力やレイテンシスパイクが発生した場合、コード変更なしで切り戻せます。

成功タスクあたりのコスト：本当の比較軸

トークン単価はコストの一部に過ぎません。Gemini 3.5 Flashが自分のワークロードでリトライやフォールバックを減らし、初回成功率を上げるなら、実効コストの差は縮まります。

指標	着目すべきポイント
リクエストあたりのトークンコスト	直接的な料金差
リトライ率	最初のレスポンスがバリデーションに失敗する頻度
フォールバック率	Flashがより強力なモデルにエスカレートする頻度
レイテンシ	最初のトークンまでの時間と完全な生成時間
タスク成功率	初回で合格基準を満たす割合
成功タスクあたりのコスト	リトライ・フォールバック・無駄なトークンを含めた混合コスト

トークン単価が3倍でも初回で成功するモデルは、2〜3回のリトライが必要なモデルよりも安くなり得ます。

Gemini 3.1 Flash Lite Previewという選択肢

Gemini 3.5 Flashは高い、Gemini 3 Flash Previewは安定性が足りないという場合は、Gemini 3.1 Flash Lite Preview（$0.25/$1.50 / 1Mトークン）も検討に値します。Gemini Flashファミリーで最も安価なオプションで、レイテンシとコストを最優先する大量・リトライ許容型のワークロード向けです。

モデル	入力	出力	適したユースケース
Gemini 3.1 Flash Lite Preview	$0.25	$1.50	最大ボリューム、コスト最優先
Gemini 3 Flash Preview	$0.50	$3.00	コストと機能のバランス
Gemini 3.5 Flash	$1.50	$9.00	GA安定性とエージェントワークフロー

FAQ

Gemini 3.5 FlashはGemini 3 Flash Previewの直接的な置き換えですか？

機能面ではその通りです。両モデルとも同じ入力モダリティ、関数呼び出し、構造化出力、context cachingに対応しています。ただし、Gemini 3.5 Flashはより高い料金帯のGAモデルであり、Gemini 3 Flash PreviewはPreview料金で引き続き利用可能です。

Gemini 3 Flash Previewは廃止されますか？

2026年5月20日時点で、GoogleはGemini 3 Flash Previewの廃止日を発表していません。ただし、Previewモデルは一般的に安定版に置き換えられていく傾向があります。Gemini APIリリースノートで廃止アナウンスを確認してください。

EvoLink経由で両モデルを利用できますか？

はい。EvoLinkの統合APIは両方のモデルIDに対応しています。コスト、品質、レイテンシの要件に応じて異なるワークロードを異なるモデルにルーティングでき、個別のプロバイダー統合を管理する必要はありません。

3倍の料金アップは妥当ですか？

ワークロードによります。大量・コスト重視で、Gemini 3 Flash Previewの品質が既に十分なタスクでは、アップグレードは正当化されないかもしれません。エージェントワークフロー、構造化出力パイプライン、GA安定性が必要な本番システムでは、推論と信頼性の向上がコスト増を相殺できます。

移行前にどうテストすればよいですか？

本番ワークロードの代表的なサンプルで両モデルを実行してください。タスク成功率、リトライ率、レイテンシ、成功タスクあたりのコストを比較しましょう。「新しいモデルは全般的に優れている」という想定ではなく、実測データに基づいて判断してください。

EvoLinkでGemini Flashモデルを比較する

EvoLinkはGemini 3.5 FlashとGemini 3 Flash Previewの両方にアクセスできる統合APIを提供しています。1つの統合でルーティング、フォールバック動作、ワークロードレベルのコストをテストできます。

Gemini 3.5 Flash API — 料金、モデルID、Playgroundを含む製品ページ
Gemini 3.5 Flash料金ガイド — トークンコストの内訳と本番予算の例
Gemini 3.5 Flashでコーディングエージェント — エージェントワークフロー評価とコスト分析
Gemini 3.5 Flash vs Claude Haiku 4.5 — ファミリー横断のコスト効率比較
Gemini 3.5 Flash APIリリースウォッチ — リリース状況の追跡

EvoLinkで探す：

Gemini 3.5 Flash API — $1.50/$9.00 1M トークンあたり、安定版 GA
Gemini 3 Flash Preview API — $0.50/$3.00 1M トークンあたり、プレビュー
Gemini APIファミリー — 価格とワークロードで全Geminiルートを比較

ソース

すべての記事

#Gemini 3.5 Flash #Gemini 3 Flash Preview #Gemini API #model migration #Flash models