Gemini Omni Flash API
$1.275(~ 86.7 credits) 100만 입력 토큰당; $14.875(~ 1011.5 credits) 100만 비디오 출력 토큰당
$7.650(~ 520.2 credits) 100만 기타 출력 토큰당
토큰 기반 과금입니다. 실제 비용은 API가 반환하는 usage 객체를 따릅니다.
99.9% 가용성이 보장되는 가장 안정적인 버전으로, 프로덕션 환경에 권장됩니다.
Use the same video endpoint for all modes. Only the model parameter differs.
Choose landscape, portrait, or Auto to let the provider select the output ratio.
Auto lets the provider decide the output duration (estimated as 10s). Choose 3-10s to send a fixed duration.
Click Generate to see preview
기록
최대 20개 항목0 실행 중 · 0 완료됨
EvoLink의 Gemini Omni Flash API
EvoLink의 통합 동영상 API로 Gemini Omni Flash를 사용해 텍스트-비디오, 이미지-비디오, 레퍼런스-비디오, 비디오 편집을 실행할 수 있습니다. 외부 논의에서는 Gemini Omni를 Nano Banana의 비디오 버전처럼 보는 경우가 많습니다. 멀티모달 동영상 제작과 대화형 편집을 짧은 동영상 워크플로우로 가져오기 때문입니다. EvoLink에서의 실질적인 가치는 API 접근성입니다: EvoLink model ID, 비동기 태스크 워크플로우, callback 지원, 토큰 기반 사용량 가시성, 그리고 Veo, Seedance, Kling 등 다른 동영상 모델과 같은 API key 사용입니다.

Billing Rules
- •Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes.
- •Text input: counted from the prompt tokens.
- •Video input: 5,792 tokens per second of input video.
- •Video output: 5,792 tokens per second of 720p video (audio included).
- •The output follows the input video, so video edit does not accept duration or aspect_ratio.
Pricing
| Model | Mode | Meter | Price |
|---|---|---|---|
| Text to Video | Output video | Video output tokens | $0.015/ 1K tokens(1.0115 Credits) |
| Text to Video | Input text / image / video | Input tokens | $0.0013/ 1K tokens(0.0867 Credits) |
| Text to Video | Thinking / text output | Other output tokens | $0.0077/ 1K tokens(0.5202 Credits) |
If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.
Figures are pre-bill estimates. Actual charges follow the upstream usage tokens returned by the model.
Gemini Omni API로 무엇을 만들 수 있나요?
채팅 기반 동영상 편집
Gemini Omni로 클립을 생성한 뒤, 대화를 통해 수정할 수 있습니다 — "조명을 따뜻하게 해줘", "빨간 차를 교체해줘". 이 워크플로우는 반복 편집을 위해 설계되었으며 선택한 라우트가 지원하는 범위 안에서 주변 장면, 피사체 정체성, 움직임의 연속성을 최대한 유지합니다.

오브젝트 교체 및 장면 재작성
프레임 내 오브젝트를 교체하거나, 불필요한 요소를 제거하거나, 아이덴티티와 모션을 유지하면서 장면을 재작성할 수 있습니다. 외부 편집 도구 없이 광고 크리에이티브 반복 작업과 제품 변형 렌더링에 유용합니다.

레퍼런스 이미지 워크플로우
레퍼런스 이미지를 전달하면 Gemini Omni가 캐릭터 아이덴티티, 조명, 색상을 생성된 영상 전반에 걸쳐 고정합니다. 채팅 기반 편집과 결합하면 시각적 일관성을 잃지 않고 특정 샷을 다듬을 수 있습니다.

오디오 지원 동영상 생성
선택한 모드가 지원하는 경우 Gemini Omni Flash 라우트는 오디오가 포함된 짧은 동영상 출력을 반환할 수 있습니다. 첫 생성 단계에서 별도의 TTS나 사운드 디자인 파이프라인을 붙이는 작업을 줄여 줍니다.

Gemini Omni 비교 — 모든 모델을 하나의 EvoLink API key로
Gemini Omni의 핵심은 워크플로우입니다: 멀티모달 입력, 대화형 편집, 그리고 EvoLink를 통해 Veo, Seedance, Kling과 같은 API key로 나란히 평가할 수 있는 실용적인 접근 경로입니다.
채팅 네이티브 편집 워크플로우
Gemini Omni는 대화형 동영상 편집을 중심으로 포지셔닝되어 있으며, Veo 3.1과 Seedance 2.0은 보통 먼저 생성 라우트로 평가됩니다. 멀티턴 수정에서는 이 워크플로우 차이를 직접 테스트할 가치가 있습니다.
롱 컨텍스트 캐릭터 일관성
Gemini Omni는 Gemini의 컨텍스트와 세계 지식 덕분에 멀티 입력 및 편집 중심 워크플로우에서 연속성에 도움이 될 수 있다고 평가됩니다. 실제 스토리보드나 짧은 동영상 프롬프트로 검증하세요.
Google Cloud 프로젝트 불필요 — Veo, Seedance와 동일한 비동기 패턴
GCP 설정, Vertex 빌링, 별도 리전 승인이 필요 없습니다. 이미 EvoLink를 통해 동영상 생성을 하고 있다면, Gemini Omni 추가는 파라미터 하나만 변경하면 됩니다 — 요청 형식과 태스크 라이프사이클이 Veo 3.1, Seedance 2.0, Kling과 동일합니다.
Gemini Omni vs Veo 3.1 vs Seedance 2.0 — 나란히 비교
2026년 프로덕션 동영상 워크플로우에서 자주 비교되는 세 가지 모델. 모두 하나의 EvoLink API key로 접근 가능합니다.
| 기능 | Gemini Omni | Veo 3.1 | Seedance 2.0 |
|---|---|---|---|
| EvoLink 가격 | 토큰 기반 | From $0.50/s | From $0.092/s |
| 화질 | 720p | 720p / 1080p, 지원 시 4K 업스케일 | 480p / 720p / 1080p |
| 네이티브 오디오 | Yes | Yes | Yes |
| 레퍼런스 제어 | 텍스트 + 이미지 + 채팅 편집 | 텍스트 + 이미지 | 텍스트 + 이미지 + 비디오 + 오디오 |
| 영상 길이 | 3-10s / Auto | 짧은 클립, 지원 시 Extend로 긴 장면 구성 | 4–15s |
| 편집 | 채팅 네이티브, 멀티턴 | 생성 우선 | V2V 모드 |
| 최적 용도 | 편집 중심 워크플로우 | 시네마틱 기본 품질 | 멀티모달 레퍼런스 프로덕션 |
Gemini Omni API 연동 방법
첫 번째 Gemini Omni 동영상 태스크까지 세 단계. Veo 3.1, Seedance 2.0, Kling 3.0과 동일한 연동 패턴입니다.
Step 1 — API Key 발급
EvoLink.ai에 가입하고 대시보드에서 API key를 생성하세요. Google Cloud 프로젝트는 필요 없습니다.
Step 2 — 생성 태스크 제출
/v1/videos/generations 엔드포인트에 Gemini Omni Flash 모델명과 프롬프트를 포함해 POST 요청을 보내세요. 생성 모드는 duration으로 3-10초 또는 Auto를 설정할 수 있고, 이미지-비디오 또는 레퍼런스-비디오에는 image_urls, 비디오 편집에는 video_urls, 완료 알림에는 callback_url을 사용할 수 있습니다. API는 비동기로 처리되며 task_id를 반환합니다.
Step 3 — 동영상 결과 수신
task_id로 상태 엔드포인트를 폴링하거나, callback_url 웹훅을 기다리세요. 상태가 completed가 되면 생성된 MP4의 다운로드 URL을 받게 됩니다. 링크는 24시간 동안 유효합니다.
Gemini Omni API 기능
프로덕션 동영상 워크플로우를 위한 기술 사양입니다.
채팅 기반 동영상 편집
대화형 워크플로우에서 멀티턴 수정을 지원하며, 장면 연속성은 선택한 라우트와 입력 품질에 따라 달라집니다.
720p, 3-10초 / Auto 클립
생성 모드는 720p, 3-10초 또는 Auto 클립을 설정할 수 있습니다. Auto는 10초로 예상됩니다. 비디오 편집은 최대 10초 MP4 입력 1개를 받습니다.
텍스트-투-비디오 및 이미지-투-비디오
프롬프트 기반 T2V와 레퍼런스 이미지 입력 I2V를 지원합니다. 채팅 편집은 두 모드의 출력 모두에 적용됩니다.
오디오 지원 동영상 출력
선택한 Gemini Omni Flash 라우트가 지원하는 경우 짧은 동영상 출력에 오디오를 포함할 수 있습니다.
롱 컨텍스트 캐릭터 일관성
멀티 입력 및 편집 중심 워크플로우에서 더 나은 연속성을 목표로 합니다. 실제 프로덕션 프롬프트로 일관성을 검증하세요.
비동기 API — task_id 및 callback 지원
태스크를 제출하고 ID를 받은 뒤, 상태를 폴링하거나 callback_url을 설정하세요. 다른 EvoLink 동영상 모델과 동일한 라이프사이클입니다.
비용 예시 — Gemini Omni 예상 가격
소셜 미디어 배치용 3-10초/Auto 클립 100개
현재 Pricing 탭 요금으로 산정
프로덕션 규모 월간 3-10초/Auto 클립 1,000개
현재 Pricing 탭 요금으로 산정
1회 생성 + 3회 편집 멀티턴 워크플로우
현재 Pricing 탭 요금으로 산정
현재 토큰 기반 요금은 위 Pricing 탭에서 확인하세요. workflow는 model 파라미터를 변경해 선택합니다.
Gemini Omni API 자주 묻는 질문
Everything you need to know about the product and billing.
전체 Gemini 동영상 API 모델
EvoLink는 하나의 API key로 Google의 동영상 및 미디어 모델 패밀리에 대한 통합 접근을 제공합니다. 모든 모델은 동일한 EvoLink API 엔드포인트를 공유합니다. 파라미터 하나로 모델을 전환하세요.
API Reference
Select endpoint
Authentication
All APIs require Bearer Token authentication.
Authorization:
Bearer YOUR_API_KEY/v1/videos/generationsCreate Gemini Omni Flash Video Task
Text to Video uses the unified EvoLink video generation endpoint. Select the mode by changing the model parameter.
Asynchronous processing returns a task ID. Use it to , or provide callback_url for completion notifications.
Generated outputs should be stored in your own system when result URLs are time-limited.
Request Parameters
modelstringRequiredDefault: gemini-omni-flash-text-to-videoGemini Omni Flash model name. Fixed to gemini-omni-flash-text-to-video for text-to-video generation.
gemini-omni-flash-text-to-videopromptstringRequiredNatural-language instruction describing the requested video.
Create a cinematic product video with smooth camera motion and natural audio ambienceaspect_ratiostringOptionalDefault: 16:9Output aspect ratio. Use auto to let the provider choose.
| Value | Description |
|---|---|
| 16:9 | Landscape video |
| 9:16 | Portrait video |
| auto | Let the provider choose the output ratio |
16:9durationinteger or stringOptionalDefault: 10 if omittedOutput video duration in seconds. The Playground sends auto by default.
| Value | Description |
|---|---|
| 3-10 | Any integer from 3 to 10 seconds. If omitted, the API default is 10 seconds. |
| auto | Let the provider decide the output duration. Playground sends auto by default and estimates it as 10 seconds. |
Notes
- Use auto to let the model decide the duration; reservations estimate auto as 10 seconds
- Affects the estimated reservation; completed tasks are billed from API usage tokens
autocallback_urlstringOptionalOptional HTTPS callback address after task completion.
Notes
- Use polling if no callback_url is provided
- Store outputs promptly when result URLs are time-limited
https://your-domain.com/webhooks/video-task-completedRequest Example
Response Example
Billing Rules
Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes. Token counts per material:
- Text input — counted from the prompt tokens.
- Video output — 5,792 tokens per second of 720p video (audio included).
- Duration only affects the reservation estimate; Auto is estimated as 10 seconds.