
Gemini 3.5 Flash vs Gemini 3 Flash Preview:料金・コンテキスト・移行ガイド

まとめ
- Gemini 3 Flash Previewは
$0.50/$3.00/ 1Mトークン(入力/出力)で、引き続き安価な選択肢です。コスト重視・大量処理で、Preview状態を許容できるワークロードに適しています。 - Gemini 3.5 Flashは
$1.50/$9.00/ 1Mトークンですが、安定したGAモデルとして、推論・関数呼び出し・構造化出力が強化されており、エージェントワークフローに向いています。 - 両モデルとも1Mトークンのコンテキストウィンドウと65,536トークンの出力上限を共有しています。
- API上の移行はシンプルです(モデルIDの変更のみ)。ただしコストへの影響は大きいため、切り替え前に試算してください。
比較表
| 項目 | Gemini 3.5 Flash | Gemini 3 Flash Preview |
|---|---|---|
| Model ID | gemini-3.5-flash | gemini-3-flash-preview |
| ステータス | 安定版 (GA) | Preview |
| 入力料金 | $1.50 / 1M tokens | $0.50 / 1M tokens |
| 出力料金 | $9.00 / 1M tokens | $3.00 / 1M tokens |
| キャッシュヒット料金 | $0.15 / 1M tokens | $0.05 / 1M tokens |
| 音声入力料金 | $1.50 / 1M tokens | $1.00 / 1M tokens |
| コンテキストウィンドウ | 1,000,000 tokens | 1,048,576 tokens |
| 出力上限 | 65,536 tokens | 65,536 tokens |
| マルチモーダル入力 | Text, image, video, audio, PDF | Text, image, video, audio, PDF |
| 関数呼び出し | Yes | Yes |
| 構造化出力 | Yes | Yes |
| コード実行 | Yes | Yes |
| Context caching | Yes | Yes |
| Batch API | Yes | Yes |
| Google Search grounding | Yes | Yes |
| 組み込み推論 | Yes(強化版) | Yes |
Gemini 3 Flash Previewを使い続けるべきケース
以下のような状況では、Gemini 3 Flash Previewが引き続き有力な選択肢です。
コストが最優先
$0.50、出力$3.00 / 1Mトークンで、Gemini 3 Flash PreviewはGemini 3.5 Flashの3分の1の料金です。分類、抽出、フォーマット変換、ルーティングなど、品質が既に十分な大量処理タスクでは、コスト差が急速に積み上がります。| モデル | 1日の入力コスト | 1日の出力コスト | 1日の合計 | 月間合計 |
|---|---|---|---|---|
| Gemini 3 Flash Preview | $5.00 | $6.00 | $11.00 | $330 |
| Gemini 3.5 Flash | $15.00 | $18.00 | $33.00 | $990 |
1つのパイプラインだけで月額$660の差になります。
Previewステータスが許容できる
APIの動作が変わることがあっても問題ないワークロードで、すでにPreviewモデルの運用(バージョン固定、更新時のテストなど)に慣れているなら、Gemini 3 Flash Previewに留まることで不要な移行コストを避けられます。
現状の品質が合格基準を満たしている
既存のGemini 3 Flash Preview連携がスキーマ検証、事実精度、レイテンシ、リトライ率の基準をクリアしているなら、新しいモデルがあるという理由だけで移行する必要はありません。
Gemini 3.5 Flashに移行すべきケース
以下のような状況では、Gemini 3.5 Flashへの移行が合理的です。
GA水準の安定性が必要
Previewモデルはバージョン間で動作が変わる可能性があります。Gemini 3.5 FlashはGAモデルとしてリリースされており、予期せぬリグレッションを許容できない本番デプロイに適しています。
エージェントワークフローでより強い推論が求められる
Gemini 3.5 Flashには強化された組み込み推論機能があります。多段階の計画、ツール選択、複雑な関数呼び出しチェーンを含むエージェントのサブステップでは、推論の改善がリトライ率やフォールバック頻度を下げ、トークン単価の上昇を相殺できる場合があります。
構造化出力の信頼性が重要
パイプラインが厳格なスキーマ準拠(JSON mode、関数呼び出しレスポンス、型付き出力)に依存している場合、Gemini 3.5 Flashの改善された構造化出力により、バリデーション失敗や下流のエラーハンドリングを削減できます。
新規プロジェクトをゼロから構築する
既存のGemini 3 Flash Preview連携がない新規プロジェクトでは、最初からGemini 3.5 Flashを採用することで、将来廃止される可能性のあるPreviewモデル上に構築するリスクを回避できます。
移行チェックリスト
Gemini 3 Flash PreviewからGemini 3.5 Flashへの移行を決定した場合:
1. モデルIDを更新する
gemini-3-flash-preview → gemini-3.5-flash
EvoLinkの統合APIを利用している場合は、リクエスト内のmodelパラメータを変更するだけです。エンドポイントや認証の変更は不要です。
2. 予算を再試算する
現在のGemini 3 Flash Previewの支出を約3倍にして、Gemini 3.5 Flashのコストを見積もってください。推論の改善によりリトライ率が下がるワークロードでは、その分の節約も考慮に入れましょう。
3. 並行評価を実施する
本番トラフィックを切り替える前に、同じワークロードサンプルで両モデルを実行してください。比較項目:
- タスク成功率
- リトライ率
- レイテンシ(最初のトークンまでの時間と完全な生成時間)
- スキーマ妥当性
- 成功タスクあたりのコスト
4. モニタリングとアラートを更新する
コストアラートと予算閾値を新しい料金体系に合わせて調整してください。
5. フォールバックを計画する
移行期間中はGemini 3 Flash Previewをフォールバックルートとして維持してください。Gemini 3.5 Flashでクォータ圧力やレイテンシスパイクが発生した場合、コード変更なしで切り戻せます。
成功タスクあたりのコスト:本当の比較軸
トークン単価はコストの一部に過ぎません。Gemini 3.5 Flashが自分のワークロードでリトライやフォールバックを減らし、初回成功率を上げるなら、実効コストの差は縮まります。
| 指標 | 着目すべきポイント |
|---|---|
| リクエストあたりのトークンコスト | 直接的な料金差 |
| リトライ率 | 最初のレスポンスがバリデーションに失敗する頻度 |
| フォールバック率 | Flashがより強力なモデルにエスカレートする頻度 |
| レイテンシ | 最初のトークンまでの時間と完全な生成時間 |
| タスク成功率 | 初回で合格基準を満たす割合 |
| 成功タスクあたりのコスト | リトライ・フォールバック・無駄なトークンを含めた混合コスト |
トークン単価が3倍でも初回で成功するモデルは、2〜3回のリトライが必要なモデルよりも安くなり得ます。
Gemini 3.1 Flash Lite Previewという選択肢
$0.25/$1.50 / 1Mトークン)も検討に値します。Gemini Flashファミリーで最も安価なオプションで、レイテンシとコストを最優先する大量・リトライ許容型のワークロード向けです。| モデル | 入力 | 出力 | 適したユースケース |
|---|---|---|---|
| Gemini 3.1 Flash Lite Preview | $0.25 | $1.50 | 最大ボリューム、コスト最優先 |
| Gemini 3 Flash Preview | $0.50 | $3.00 | コストと機能のバランス |
| Gemini 3.5 Flash | $1.50 | $9.00 | GA安定性とエージェントワークフロー |
FAQ
Gemini 3.5 FlashはGemini 3 Flash Previewの直接的な置き換えですか?
機能面ではその通りです。両モデルとも同じ入力モダリティ、関数呼び出し、構造化出力、context cachingに対応しています。ただし、Gemini 3.5 Flashはより高い料金帯のGAモデルであり、Gemini 3 Flash PreviewはPreview料金で引き続き利用可能です。
Gemini 3 Flash Previewは廃止されますか?
EvoLink経由で両モデルを利用できますか?
はい。EvoLinkの統合APIは両方のモデルIDに対応しています。コスト、品質、レイテンシの要件に応じて異なるワークロードを異なるモデルにルーティングでき、個別のプロバイダー統合を管理する必要はありません。
3倍の料金アップは妥当ですか?
ワークロードによります。大量・コスト重視で、Gemini 3 Flash Previewの品質が既に十分なタスクでは、アップグレードは正当化されないかもしれません。エージェントワークフロー、構造化出力パイプライン、GA安定性が必要な本番システムでは、推論と信頼性の向上がコスト増を相殺できます。
移行前にどうテストすればよいですか?
本番ワークロードの代表的なサンプルで両モデルを実行してください。タスク成功率、リトライ率、レイテンシ、成功タスクあたりのコストを比較しましょう。「新しいモデルは全般的に優れている」という想定ではなく、実測データに基づいて判断してください。
EvoLinkでGemini Flashモデルを比較する
EvoLinkはGemini 3.5 FlashとGemini 3 Flash Previewの両方にアクセスできる統合APIを提供しています。1つの統合でルーティング、フォールバック動作、ワークロードレベルのコストをテストできます。
関連記事:
- Gemini 3.5 Flash API — 料金、モデルID、Playgroundを含む製品ページ
- Gemini 3.5 Flash料金ガイド — トークンコストの内訳と本番予算の例
- Gemini 3.5 Flashでコーディングエージェント — エージェントワークフロー評価とコスト分析
- Gemini 3.5 Flash vs Claude Haiku 4.5 — ファミリー横断のコスト効率比較
- Gemini 3.5 Flash APIリリースウォッチ — リリース状況の追跡
EvoLinkで探す:
- Gemini 3.5 Flash API — $1.50/$9.00 1M トークンあたり、安定版 GA
- Gemini 3 Flash Preview API — $0.50/$3.00 1M トークンあたり、プレビュー
- Gemini APIファミリー — 価格とワークロードで全Geminiルートを比較


