Seedance 2.0 Mini が登場しました今すぐ試す

Gemini Omni Flash API

EvoLink の Gemini Omni Flash API — 1つの API key で動画生成と動画編集、非同期タスクワークフロー、callback 対応。
価格: 

$1.275(~ 86.7 credits) 100万入力トークンあたり; $14.875(~ 1011.5 credits) 100万動画出力トークンあたり

$7.650(~ 520.2 credits) 100万その他出力トークンあたり

トークンベースの課金です。実際の料金は API が返す usage オブジェクトに従います。

99.9% の稼働率を保証する最も安定した構成で、本番環境に推奨されます。

Use the same video endpoint for all modes. Only the model parameter differs.

Output is 720p with audio. Duration resets to Auto; drag the slider to send a fixed 3-10s duration.
131 (推奨:2,000)

Choose landscape, portrait, or Auto to let the provider select the output ratio.

Auto lets the provider decide the output duration (estimated as 10s). Choose 3-10s to send a fixed duration.

Click Generate to see preview

履歴

最大20件

0 実行中 · 0 完了

ここに生成履歴が表示されます

EvoLink の Gemini Omni Flash API

EvoLink の統合動画 API で Gemini Omni Flash を使い、テキストから動画、画像から動画、参照画像から動画、動画編集を実行できます。外部では、Gemini Omni は Nano Banana の動画版に近いものとして語られることが多く、マルチモーダルな動画制作と会話型編集を短尺動画ワークフローに持ち込みます。 EvoLink での実用価値は API アクセスです。EvoLink model ID、非同期タスクワークフロー、callback 対応、token ベースの使用量可視化、そして Veo、Seedance、Kling などの動画モデルと同じ API key で利用できます。

EvoLink 上の Gemini Omni API 動画ワークフロー

Billing Rules

  • Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes.
  • Text input: counted from the prompt tokens.
  • Video input: 5,792 tokens per second of input video.
  • Video output: 5,792 tokens per second of 720p video (audio included).
  • The output follows the input video, so video edit does not accept duration or aspect_ratio.

Pricing

Text to Video
Output video
Meter:Video output tokens
Price:
$0.015/ 1K tokens
(1.0115 Credits)
Text to Video
Input text / image / video
Meter:Input tokens
Price:
$0.0013/ 1K tokens
(0.0867 Credits)
Text to Video
Thinking / text output
Meter:Other output tokens
Price:
$0.0077/ 1K tokens
(0.5202 Credits)

If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.

EVOLINK · PRICE EST.gemini-omni-flash
Auto estimated as 10s · real-time

Figures are pre-bill estimates. Actual charges follow the upstream usage tokens returned by the model.

Your estimate
~$0.86959.106
Official· saves ~15%
~$1.02369.537
Tokens per task
video output57,920
text input0
other output1,000
Mode
Duration
Prompt
0 chars · ~0 text tokens

Gemini Omni API で何が作れる?

チャットベース動画編集

Gemini Omni でクリップを生成し、会話の中で洗練します —「ライティングをもっと暖かく」「赤い車を差し替えて」。このワークフローは反復編集向けで、選択したルートの対応範囲内で周囲のシーン、被写体の同一性、動きの連続性をできるだけ保ちます。

Gemini Omni チャットベース動画編集

オブジェクト置換とシーン書き換え

フレーム内のオブジェクトを差し替え、不要な要素を削除、またはアイデンティティとモーションを保持しながらシーンを書き換えます。外部編集ツール不要で、広告クリエイティブの反復や商品バリエーションのレンダリングに活用できます。

Gemini Omni オブジェクト置換とシーン書き換え

リファレンス画像ワークフロー

リファレンス画像を渡すと、Gemini Omni がキャラクターのアイデンティティ、ライティング、カラーを生成動画全体でアンカーします。チャットベース編集と組み合わせれば、ビジュアルの一貫性を失わずに特定のショットを調整できます。

Gemini Omni リファレンス画像ワークフロー

音声対応の動画生成

選択したモードが対応している場合、Gemini Omni Flash ルートは音声付きの短尺動画出力を返せます。初回生成で別途 TTS やサウンドデザインのパイプラインを組み合わせる手間を減らせます。

Gemini Omni 音声対応の動画生成

Gemini Omni の比較 — すべてのモデルを1つの EvoLink API key で

Gemini Omni の注目点はワークフローです。マルチモーダル入力、会話型編集、そして EvoLink 経由で Veo、Seedance、Kling と同じ API key で並行評価できる実用的な接続ルートがあります。

チャットネイティブな編集ワークフロー

Gemini Omni は会話型動画編集を軸にしたモデルとして位置づけられます。一方で Veo 3.1 と Seedance 2.0 は通常、まず生成ルートとして評価されます。マルチターン編集では、このワークフロー差を実測する価値があります。

ロングコンテキストによるキャラクター一貫性

Gemini Omni は Gemini の文脈理解と世界知識により、マルチ入力や編集中心のワークフローで連続性を保ちやすいとされています。実際のストーリーボードや短尺動画プロンプトで評価してください。

Google Cloud プロジェクト不要 — Veo・Seedance と同じ非同期パターン

GCP のセットアップ不要、Vertex の課金設定不要、リージョン承認も不要です。すでに EvoLink で動画生成を運用しているなら、Gemini Omni の追加はパラメータ1つの変更だけ — Veo 3.1、Seedance 2.0、Kling と同じリクエスト形式、同じタスクライフサイクルです。

Gemini Omni vs Veo 3.1 vs Seedance 2.0 — 横並び比較

2026年の本番動画ワークフローで候補に挙がる3モデル。すべて1つの EvoLink API key でアクセス可能です。

機能Gemini OmniVeo 3.1Seedance 2.0
EvoLink 価格トークンベースFrom $0.50/sFrom $0.092/s
画質720p720p / 1080p、利用可能な場合は 4K アップスケール480p / 720p / 1080p
ネイティブ音声YesYesYes
リファレンス制御Text + image + chat editText + imageText + image + video + audio
動画の長さ3-10s / Auto短尺クリップ、対応時は Extend で長尺シーン化4–15s
編集チャットネイティブ、マルチターン生成ファーストV2V モード
最適な用途編集を多用するワークフローシネマティックベースラインマルチモーダルリファレンス制作

Gemini Omni API の統合方法

最初の Gemini Omni 動画タスクまで3ステップ。Veo 3.1、Seedance 2.0、Kling 3.0 と同じ統合パターンです。

1

Step 1 — API Key を取得

EvoLink.ai でサインアップし、ダッシュボードから API key を生成します。Google Cloud プロジェクトは不要です。

2

Step 2 — 生成タスクを送信

/v1/videos/generations に Gemini Omni Flash のモデル名とプロンプトを POST します。生成モードでは duration で 3〜10 秒または Auto を指定でき、画像動画生成または参照画像動画生成には image_urls、動画編集には video_urls、完了通知には callback_url を指定できます。API は非同期で処理し、task_id を返します。

3

Step 3 — 動画結果を取得

task_id でステータスエンドポイントをポーリングするか、callback_url の webhook を待ちます。ステータスが completed になると、生成された MP4 のダウンロード URL を受け取れます。リンクの有効期限は24時間です。

Gemini Omni API の機能

本番動画ワークフロー向けの技術仕様です。

編集

チャットベース動画編集

会話型ワークフローでマルチターン編集を行えます。シーン連続性は選択したルートと入力品質に依存します。

出力

720p、3〜10秒 / Auto のクリップ

生成モードでは 720p の 3〜10 秒または Auto クリップを設定できます。Auto は 10 秒として見積もられます。動画編集は最大 10 秒の MP4 入力を1つ受け付けます。

モード

テキストから動画 & 画像から動画

プロンプトからの T2V と、リファレンス画像入力による I2V に対応。チャット編集はどちらのモードの出力にも適用できます。

音声

音声対応の動画出力

選択した Gemini Omni Flash ルートが対応している場合、短尺動画出力に音声を含められます。

一貫性

ロングコンテキストによるキャラクター一貫性

マルチ入力や編集中心のワークフローでの連続性を重視した設計です。本番プロンプトで一貫性を検証してください。

ワークフロー

非同期 API — task_id と callback 対応

タスクを送信し、ID を受け取り、ステータスをポーリングまたは callback_url を設定。他の EvoLink 動画モデルと同じライフサイクルです。

コスト例 — Gemini Omni 料金見積もり

SNS バッチ用 100本 × 3〜10秒/Auto クリップ

現在の Pricing タブ料金で見積もり

本番規模で月間 1,000本 × 3〜10秒/Auto クリップ

現在の Pricing タブ料金で見積もり

1回の生成 + 3回の編集(マルチターンワークフロー)

現在の Pricing タブ料金で見積もり

現在のトークンベース料金は上部の Pricing タブで確認できます。workflow は model パラメータを変更して選択します。

Gemini Omni API よくある質問

Everything you need to know about the product and billing.

Gemini Omni は Google I/O 2026 で発表された Google のマルチモーダル動画モデルファミリーです。Omni Flash は、テキスト・画像・動画・音声入力に対応する短尺動画ルートとして注目されています。Veo 3.1 と比べると、Gemini Omni は会話型編集とマルチ入力ワークフローで評価されており、Veo は引き続き強力なシネマティック生成の基準です。
課金は API が返す usage tokens に基づき、input、video output、other output の各トークンメーターで計算されます。現行レートは上部の料金表でご確認ください。
不要です。EvoLink は1つの API key でアクセスを提供します。Google Cloud プロジェクト不要、Vertex の課金設定不要、リージョン承認も不要です。EvoLink 上の Veo 3.1 や Seedance 2.0 と同じ認証方式です。
gemini-omni-flash-text-to-video、gemini-omni-flash-image-to-video、gemini-omni-flash-reference-to-video、gemini-omni-flash-video-edit の4モードに対応しています。すべて同じ非同期動画 API エンドポイントを使用します。
はい。タスク送信時に callback_url(HTTPS)を指定すると、タスクが終端状態に到達した際に EvoLink が POST で更新を送信できます。callback URL を指定しない場合は、ステータスエンドポイントのポーリングも利用できます。
失敗したタスクはエラー理由付きの failed ステータスを返します。アプリケーションレベルでリトライする場合は、エラーを確認し、元のパラメータをデバッグ用に保持したうえで、入力問題または一時的な失敗が明確な場合のみ再送信してください。
はい — これは Gemini Omni の主要なワークフロー差分の一つです。自然言語の編集指示を使い、選択したルートが反復間で周囲のシーン、被写体の同一性、動きの連続性をどの程度保てるかを検証してください。
生成モードでは 3〜10 秒または Auto のクリップを設定できます。Auto は予約見積もりで 10 秒として扱われます。動画編集は最大 10 秒の MP4 入力を1つ受け付けます。長いナラティブの場合は、ロングコンテキストによるキャラクター一貫性を利用して複数クリップをチェーンしてください。
はい。リファレンス画像の URL を渡すと、Gemini Omni がそれをアイデンティティアンカーとして生成動画に反映します。
Seedance 2.0 はベンチマークとマルチモーダルリファレンスで強いシグナルがあり、Veo 3.1 は Flow と Extend ワークフローを備えた強力なシネマティック生成の基準です。Gemini Omni は会話型編集、マルチ入力生成、短尺動画の反復制作で差別化されています。
はい。EvoLink は Gemini Omni、Veo 3.1、Nano Banana 2、その他の Gemini ファミリーを1つの API key で提供しています。model パラメータを変更するだけで切り替えられます。

Gemini 動画 API モデル一覧

EvoLink は Google の動画・メディアモデルファミリーに1つの API key で統一アクセスを提供します。 すべてのモデルが同じ EvoLink API エンドポイントを共有。パラメータ1つでモデルを切り替えられます。

POST
/v1/videos/generations

Create Gemini Omni Flash Video Task

Text to Video uses the unified EvoLink video generation endpoint. Select the mode by changing the model parameter.

Asynchronous processing returns a task ID. Use it to , or provide callback_url for completion notifications.

Generated outputs should be stored in your own system when result URLs are time-limited.

Request Parameters

modelstringRequiredDefault: gemini-omni-flash-text-to-video

Gemini Omni Flash model name. Fixed to gemini-omni-flash-text-to-video for text-to-video generation.

Examplegemini-omni-flash-text-to-video
promptstringRequired

Natural-language instruction describing the requested video.

ExampleCreate a cinematic product video with smooth camera motion and natural audio ambience
aspect_ratiostringOptionalDefault: 16:9

Output aspect ratio. Use auto to let the provider choose.

ValueDescription
16:9Landscape video
9:16Portrait video
autoLet the provider choose the output ratio
Example16:9
durationinteger or stringOptionalDefault: 10 if omitted

Output video duration in seconds. The Playground sends auto by default.

ValueDescription
3-10Any integer from 3 to 10 seconds. If omitted, the API default is 10 seconds.
autoLet the provider decide the output duration. Playground sends auto by default and estimates it as 10 seconds.
Notes
  • Use auto to let the model decide the duration; reservations estimate auto as 10 seconds
  • Affects the estimated reservation; completed tasks are billed from API usage tokens
Exampleauto
callback_urlstringOptional

Optional HTTPS callback address after task completion.

Notes
  • Use polling if no callback_url is provided
  • Store outputs promptly when result URLs are time-limited
Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "gemini-omni-flash-text-to-video",
  "prompt": "Create a cinematic product video with smooth camera motion and natural audio ambience",
  "aspect_ratio": "16:9",
  "duration": "auto",
  "callback_url": "https://your-domain.com/webhooks/video-task-completed"
}

Response Example

{
  "id": "task-video-xxxxxxxx",
  "model": "gemini-omni-flash-text-to-video",
  "object": "video.generation.task",
  "status": "processing",
  "progress": 0,
  "task_info": {
    "estimated_time": 60,
    "can_cancel": false,
    "video_duration": 10
  },
  "usage": {
    "credits_reserved": 59.1089,
    "billing_rule": "per_token"
  },
  "type": "video",
  "created": 1782940800
}

Billing Rules

Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes. Token counts per material:

  • Text input — counted from the prompt tokens.
  • Video output — 5,792 tokens per second of 720p video (audio included).
  • Duration only affects the reservation estimate; Auto is estimated as 10 seconds.