Seedance 2.0 Mini 출시지금 사용해 보기

Gemini Omni Flash API

EvoLink의 Gemini Omni Flash API — 하나의 API key로 동영상 생성과 비디오 편집, 비동기 태스크 워크플로우, callback 지원까지.
가격: 

$1.275(~ 86.7 credits) 100만 입력 토큰당; $14.875(~ 1011.5 credits) 100만 비디오 출력 토큰당

$7.650(~ 520.2 credits) 100만 기타 출력 토큰당

토큰 기반 과금입니다. 실제 비용은 API가 반환하는 usage 객체를 따릅니다.

99.9% 가용성이 보장되는 가장 안정적인 버전으로, 프로덕션 환경에 권장됩니다.

Use the same video endpoint for all modes. Only the model parameter differs.

Output is 720p with audio. Duration resets to Auto; drag the slider to send a fixed 3-10s duration.
131 (권장: 2,000)

Choose landscape, portrait, or Auto to let the provider select the output ratio.

Auto lets the provider decide the output duration (estimated as 10s). Choose 3-10s to send a fixed duration.

Click Generate to see preview

기록

최대 20개 항목

0 실행 중 · 0 완료됨

여기에 생성 기록이 표시됩니다

EvoLink의 Gemini Omni Flash API

EvoLink의 통합 동영상 API로 Gemini Omni Flash를 사용해 텍스트-비디오, 이미지-비디오, 레퍼런스-비디오, 비디오 편집을 실행할 수 있습니다. 외부 논의에서는 Gemini Omni를 Nano Banana의 비디오 버전처럼 보는 경우가 많습니다. 멀티모달 동영상 제작과 대화형 편집을 짧은 동영상 워크플로우로 가져오기 때문입니다. EvoLink에서의 실질적인 가치는 API 접근성입니다: EvoLink model ID, 비동기 태스크 워크플로우, callback 지원, 토큰 기반 사용량 가시성, 그리고 Veo, Seedance, Kling 등 다른 동영상 모델과 같은 API key 사용입니다.

EvoLink에서 Gemini Omni API 동영상 워크플로우

Billing Rules

  • Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes.
  • Text input: counted from the prompt tokens.
  • Video input: 5,792 tokens per second of input video.
  • Video output: 5,792 tokens per second of 720p video (audio included).
  • The output follows the input video, so video edit does not accept duration or aspect_ratio.

Pricing

Text to Video
Output video
Meter:Video output tokens
Price:
$0.015/ 1K tokens
(1.0115 Credits)
Text to Video
Input text / image / video
Meter:Input tokens
Price:
$0.0013/ 1K tokens
(0.0867 Credits)
Text to Video
Thinking / text output
Meter:Other output tokens
Price:
$0.0077/ 1K tokens
(0.5202 Credits)

If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.

EVOLINK · PRICE EST.gemini-omni-flash
Auto estimated as 10s · real-time

Figures are pre-bill estimates. Actual charges follow the upstream usage tokens returned by the model.

Your estimate
~$0.86959.106
Official· saves ~15%
~$1.02369.537
Tokens per task
video output57,920
text input0
other output1,000
Mode
Duration
Prompt
0 chars · ~0 text tokens

Gemini Omni API로 무엇을 만들 수 있나요?

채팅 기반 동영상 편집

Gemini Omni로 클립을 생성한 뒤, 대화를 통해 수정할 수 있습니다 — "조명을 따뜻하게 해줘", "빨간 차를 교체해줘". 이 워크플로우는 반복 편집을 위해 설계되었으며 선택한 라우트가 지원하는 범위 안에서 주변 장면, 피사체 정체성, 움직임의 연속성을 최대한 유지합니다.

Gemini Omni 채팅 기반 동영상 편집

오브젝트 교체 및 장면 재작성

프레임 내 오브젝트를 교체하거나, 불필요한 요소를 제거하거나, 아이덴티티와 모션을 유지하면서 장면을 재작성할 수 있습니다. 외부 편집 도구 없이 광고 크리에이티브 반복 작업과 제품 변형 렌더링에 유용합니다.

Gemini Omni 오브젝트 교체 및 장면 재작성

레퍼런스 이미지 워크플로우

레퍼런스 이미지를 전달하면 Gemini Omni가 캐릭터 아이덴티티, 조명, 색상을 생성된 영상 전반에 걸쳐 고정합니다. 채팅 기반 편집과 결합하면 시각적 일관성을 잃지 않고 특정 샷을 다듬을 수 있습니다.

Gemini Omni 레퍼런스 이미지 워크플로우

오디오 지원 동영상 생성

선택한 모드가 지원하는 경우 Gemini Omni Flash 라우트는 오디오가 포함된 짧은 동영상 출력을 반환할 수 있습니다. 첫 생성 단계에서 별도의 TTS나 사운드 디자인 파이프라인을 붙이는 작업을 줄여 줍니다.

Gemini Omni 오디오 지원 동영상 생성

Gemini Omni 비교 — 모든 모델을 하나의 EvoLink API key로

Gemini Omni의 핵심은 워크플로우입니다: 멀티모달 입력, 대화형 편집, 그리고 EvoLink를 통해 Veo, Seedance, Kling과 같은 API key로 나란히 평가할 수 있는 실용적인 접근 경로입니다.

채팅 네이티브 편집 워크플로우

Gemini Omni는 대화형 동영상 편집을 중심으로 포지셔닝되어 있으며, Veo 3.1과 Seedance 2.0은 보통 먼저 생성 라우트로 평가됩니다. 멀티턴 수정에서는 이 워크플로우 차이를 직접 테스트할 가치가 있습니다.

롱 컨텍스트 캐릭터 일관성

Gemini Omni는 Gemini의 컨텍스트와 세계 지식 덕분에 멀티 입력 및 편집 중심 워크플로우에서 연속성에 도움이 될 수 있다고 평가됩니다. 실제 스토리보드나 짧은 동영상 프롬프트로 검증하세요.

Google Cloud 프로젝트 불필요 — Veo, Seedance와 동일한 비동기 패턴

GCP 설정, Vertex 빌링, 별도 리전 승인이 필요 없습니다. 이미 EvoLink를 통해 동영상 생성을 하고 있다면, Gemini Omni 추가는 파라미터 하나만 변경하면 됩니다 — 요청 형식과 태스크 라이프사이클이 Veo 3.1, Seedance 2.0, Kling과 동일합니다.

Gemini Omni vs Veo 3.1 vs Seedance 2.0 — 나란히 비교

2026년 프로덕션 동영상 워크플로우에서 자주 비교되는 세 가지 모델. 모두 하나의 EvoLink API key로 접근 가능합니다.

기능Gemini OmniVeo 3.1Seedance 2.0
EvoLink 가격토큰 기반From $0.50/sFrom $0.092/s
화질720p720p / 1080p, 지원 시 4K 업스케일480p / 720p / 1080p
네이티브 오디오YesYesYes
레퍼런스 제어텍스트 + 이미지 + 채팅 편집텍스트 + 이미지텍스트 + 이미지 + 비디오 + 오디오
영상 길이3-10s / Auto짧은 클립, 지원 시 Extend로 긴 장면 구성4–15s
편집채팅 네이티브, 멀티턴생성 우선V2V 모드
최적 용도편집 중심 워크플로우시네마틱 기본 품질멀티모달 레퍼런스 프로덕션

Gemini Omni API 연동 방법

첫 번째 Gemini Omni 동영상 태스크까지 세 단계. Veo 3.1, Seedance 2.0, Kling 3.0과 동일한 연동 패턴입니다.

1

Step 1 — API Key 발급

EvoLink.ai에 가입하고 대시보드에서 API key를 생성하세요. Google Cloud 프로젝트는 필요 없습니다.

2

Step 2 — 생성 태스크 제출

/v1/videos/generations 엔드포인트에 Gemini Omni Flash 모델명과 프롬프트를 포함해 POST 요청을 보내세요. 생성 모드는 duration으로 3-10초 또는 Auto를 설정할 수 있고, 이미지-비디오 또는 레퍼런스-비디오에는 image_urls, 비디오 편집에는 video_urls, 완료 알림에는 callback_url을 사용할 수 있습니다. API는 비동기로 처리되며 task_id를 반환합니다.

3

Step 3 — 동영상 결과 수신

task_id로 상태 엔드포인트를 폴링하거나, callback_url 웹훅을 기다리세요. 상태가 completed가 되면 생성된 MP4의 다운로드 URL을 받게 됩니다. 링크는 24시간 동안 유효합니다.

Gemini Omni API 기능

프로덕션 동영상 워크플로우를 위한 기술 사양입니다.

편집

채팅 기반 동영상 편집

대화형 워크플로우에서 멀티턴 수정을 지원하며, 장면 연속성은 선택한 라우트와 입력 품질에 따라 달라집니다.

출력

720p, 3-10초 / Auto 클립

생성 모드는 720p, 3-10초 또는 Auto 클립을 설정할 수 있습니다. Auto는 10초로 예상됩니다. 비디오 편집은 최대 10초 MP4 입력 1개를 받습니다.

모드

텍스트-투-비디오 및 이미지-투-비디오

프롬프트 기반 T2V와 레퍼런스 이미지 입력 I2V를 지원합니다. 채팅 편집은 두 모드의 출력 모두에 적용됩니다.

오디오

오디오 지원 동영상 출력

선택한 Gemini Omni Flash 라우트가 지원하는 경우 짧은 동영상 출력에 오디오를 포함할 수 있습니다.

일관성

롱 컨텍스트 캐릭터 일관성

멀티 입력 및 편집 중심 워크플로우에서 더 나은 연속성을 목표로 합니다. 실제 프로덕션 프롬프트로 일관성을 검증하세요.

워크플로우

비동기 API — task_id 및 callback 지원

태스크를 제출하고 ID를 받은 뒤, 상태를 폴링하거나 callback_url을 설정하세요. 다른 EvoLink 동영상 모델과 동일한 라이프사이클입니다.

비용 예시 — Gemini Omni 예상 가격

소셜 미디어 배치용 3-10초/Auto 클립 100개

현재 Pricing 탭 요금으로 산정

프로덕션 규모 월간 3-10초/Auto 클립 1,000개

현재 Pricing 탭 요금으로 산정

1회 생성 + 3회 편집 멀티턴 워크플로우

현재 Pricing 탭 요금으로 산정

현재 토큰 기반 요금은 위 Pricing 탭에서 확인하세요. workflow는 model 파라미터를 변경해 선택합니다.

Gemini Omni API 자주 묻는 질문

Everything you need to know about the product and billing.

Gemini Omni는 Google I/O 2026에서 발표된 Google의 멀티모달 동영상 모델 패밀리입니다. Omni Flash는 텍스트, 이미지, 동영상, 오디오 입력을 활용하는 짧은 동영상 라우트로 논의되고 있습니다. Veo 3.1과 비교하면 Gemini Omni는 대화형 편집과 멀티 입력 워크플로우에서 평가할 가치가 크며, Veo는 여전히 강력한 시네마틱 생성 기준입니다.
과금은 API가 반환하는 usage tokens를 기준으로 하며 input, video output, other output 토큰 미터가 분리되어 있습니다. 최신 요금은 상단의 가격 표를 확인하세요.
아닙니다. EvoLink는 하나의 API key로 접근을 제공합니다. Google Cloud 프로젝트, Vertex 빌링, 별도 리전 승인이 필요 없습니다. EvoLink의 Veo 3.1 및 Seedance 2.0과 동일한 인증 방식입니다.
gemini-omni-flash-text-to-video, gemini-omni-flash-image-to-video, gemini-omni-flash-reference-to-video, gemini-omni-flash-video-edit 네 가지 모드를 지원합니다. 모두 동일한 비동기 비디오 API 엔드포인트를 사용합니다.
네. 태스크 제출 시 callback_url(HTTPS)을 전달하면, 태스크가 최종 상태에 도달했을 때 EvoLink가 POST로 업데이트를 보낼 수 있습니다. callback URL을 제공하지 않는 경우 태스크 상태 엔드포인트 폴링도 가능합니다.
실패한 태스크는 failed 상태와 오류 사유를 반환합니다. 애플리케이션 레벨에서 재시도하려면 오류를 확인하고 원래 파라미터를 디버깅용으로 보관한 뒤, 입력 문제나 일시적 실패가 명확할 때만 다시 제출하세요.
네 — 이것은 Gemini Omni의 주요 워크플로우 차이 중 하나입니다. 자연어 편집 지시를 사용하고, 선택한 라우트가 반복 과정에서 주변 장면, 피사체 정체성, 움직임을 얼마나 유지하는지 검증하세요.
생성 모드는 3-10초 또는 Auto 클립을 설정할 수 있습니다. Auto는 예약 예상에서 10초로 계산됩니다. 비디오 편집은 최대 10초 MP4 입력 1개를 받습니다. 더 긴 내러티브가 필요하면, 롱 컨텍스트 캐릭터 일관성을 활용하여 여러 클립을 연결하세요.
네. 레퍼런스 이미지 URL을 전달하면 Gemini Omni가 이를 아이덴티티 앵커로 사용하여 동영상을 생성합니다.
Seedance 2.0은 벤치마크와 멀티모달 레퍼런스 측면에서 강한 신호를 보이고, Veo 3.1은 고급 Flow 및 Extend 워크플로우를 갖춘 강력한 시네마틱 생성 기준입니다. Gemini Omni는 대화형 편집, 멀티 입력 생성, 짧은 동영상 반복 제작에서 차별화됩니다.
네. EvoLink는 Gemini Omni, Veo 3.1, Nano Banana 2 및 나머지 Gemini 패밀리를 하나의 API key로 제공합니다. model 파라미터만 변경하면 전환할 수 있습니다.

전체 Gemini 동영상 API 모델

EvoLink는 하나의 API key로 Google의 동영상 및 미디어 모델 패밀리에 대한 통합 접근을 제공합니다. 모든 모델은 동일한 EvoLink API 엔드포인트를 공유합니다. 파라미터 하나로 모델을 전환하세요.

POST
/v1/videos/generations

Create Gemini Omni Flash Video Task

Text to Video uses the unified EvoLink video generation endpoint. Select the mode by changing the model parameter.

Asynchronous processing returns a task ID. Use it to , or provide callback_url for completion notifications.

Generated outputs should be stored in your own system when result URLs are time-limited.

Request Parameters

modelstringRequiredDefault: gemini-omni-flash-text-to-video

Gemini Omni Flash model name. Fixed to gemini-omni-flash-text-to-video for text-to-video generation.

Examplegemini-omni-flash-text-to-video
promptstringRequired

Natural-language instruction describing the requested video.

ExampleCreate a cinematic product video with smooth camera motion and natural audio ambience
aspect_ratiostringOptionalDefault: 16:9

Output aspect ratio. Use auto to let the provider choose.

ValueDescription
16:9Landscape video
9:16Portrait video
autoLet the provider choose the output ratio
Example16:9
durationinteger or stringOptionalDefault: 10 if omitted

Output video duration in seconds. The Playground sends auto by default.

ValueDescription
3-10Any integer from 3 to 10 seconds. If omitted, the API default is 10 seconds.
autoLet the provider decide the output duration. Playground sends auto by default and estimates it as 10 seconds.
Notes
  • Use auto to let the model decide the duration; reservations estimate auto as 10 seconds
  • Affects the estimated reservation; completed tasks are billed from API usage tokens
Exampleauto
callback_urlstringOptional

Optional HTTPS callback address after task completion.

Notes
  • Use polling if no callback_url is provided
  • Store outputs promptly when result URLs are time-limited
Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "gemini-omni-flash-text-to-video",
  "prompt": "Create a cinematic product video with smooth camera motion and natural audio ambience",
  "aspect_ratio": "16:9",
  "duration": "auto",
  "callback_url": "https://your-domain.com/webhooks/video-task-completed"
}

Response Example

{
  "id": "task-video-xxxxxxxx",
  "model": "gemini-omni-flash-text-to-video",
  "object": "video.generation.task",
  "status": "processing",
  "progress": 0,
  "task_info": {
    "estimated_time": 60,
    "can_cancel": false,
    "video_duration": 10
  },
  "usage": {
    "credits_reserved": 59.1089,
    "billing_rule": "per_token"
  },
  "type": "video",
  "created": 1782940800
}

Billing Rules

Gemini Omni Flash is billed by token usage. The task returns a credits_reserved estimate on creation and settles from the actual usage tokens once the task completes. Token counts per material:

  • Text input — counted from the prompt tokens.
  • Video output — 5,792 tokens per second of 720p video (audio included).
  • Duration only affects the reservation estimate; Auto is estimated as 10 seconds.