Gemini API 라우트 비교
워크로드에 맞게 선택하세요: 플래그십 추론, 프로덕션 Flash 트래픽, 저비용 추출, 긴 컨텍스트 멀티모달 분석.
| 라우트 | 적합한 작업 | 가격 | 컨텍스트 창 | 모달리티 | 상태 |
|---|---|---|---|---|---|
Gemini 3.1 Pro Preview 플래그십 추론 | 최고 품질의 Gemini 추론, 코딩, 에이전트, 긴 컨텍스트 분석. | $2/$12 <=200K; $4/$18 >200K | 1M input / 64K output | 텍스트, 코드, 이미지, 비디오, 오디오, PDF 입력 | Preview flagship |
Gemini 3 Flash Preview 고속 Gemini 3 | Gemini 3 성능과 낮은 지연 시간이 필요한 멀티모달 앱. | $0.50/$3.00 per MTok (audio in: $1.00) | 1M input / 64K output | 텍스트, 이미지, 비디오, 오디오, PDF 입력 | Preview route |
Gemini 3.1 Flash Lite Preview 최저가 Gemini 3 | 대량 번역, 분류, 추출, 텍스트 배치 처리 작업. | $0.25/$1.50 per MTok (audio in: $0.50) | 1M input / 64K output | 텍스트, 이미지, 비디오, 오디오, PDF 입력 | Preview route |
Gemini 2.5 Pro 안정 Pro | 프로덕션 추론, 코딩 지원, 분석, 복잡한 멀티모달 작업. | $1.25/$10 <=200K; $2.50/$15 >200K | 1M input / 64K output | 텍스트, 이미지, 비디오, 오디오, PDF 입력 | Stable deep reasoning |
Gemini 2.5 Flash 프로덕션 Flash | 빠른 채팅, 추출, 요약, 멀티모달 프로덕션 트래픽. | $0.30/$2.50 per MTok (audio in: $1.00) | 1M input / 64K output | 텍스트, 이미지, 비디오, 오디오, PDF 입력 | Production workhorse |
| 대량 분류, 추출, 라우팅, 가벼운 채팅 플로우. | $0.10/$0.40 per MTok (audio in: $0.30) | 1M input / 64K output | 텍스트 및 오디오 입력 | Lowest-cost text route |
Gemini 모델 선택 가이드: Pro, Flash, Lite 4가지 판단 기준
아래 4가지 기준으로 Pro, Flash, Lite 중 최적 모델을 찾아보세요.
먼저 추론 깊이를 확인하세요
복잡한 코딩 에이전트, 다단계 도구 활용, 심층 문서 분석, 고정밀 출력이 필요하다면 Gemini 3.1 Pro 또는 Gemini 2.5 Pro부터 시작하세요.
그다음 지연 시간과 처리량을 확인하세요
프로덕션 채팅, 고객 지원 봇, 실시간 추출, 고빈도 멀티모달 앱이라면 Gemini 3 Flash 또는 Gemini 2.5 Flash를 비교하세요.
그다음 비용 민감도를 확인하세요
대량 분류, 배치 텍스트 처리, 라우팅, 경량 추출이 주 작업이라면 Gemini 3.1 Flash Lite 또는 Gemini 2.5 Flash Lite를 비교하세요.
마지막으로 복잡도가 혼재된 워크플로를 검토하세요
같은 파이프라인에 단순 분류와 심층 추론이 혼재한다면, 하나의 Gemini 모델을 고정하는 대신 EvoLink Smart Router를 검토하세요.
Smart Router →이미 작업 유형을 알고 계시다면, 아래 표에서 권장 시작점을 찾아보세요.
워크플로별 Gemini 모델 선택: 추론, 속도, 비용, 멀티모달
주요 작업을 기준으로 적합한 Gemini 라우트를 선택하세요.
| 작업 유형 | 권장 시작 모델 | 적합한 경우 | 주의사항 |
|---|---|---|---|
| 복잡한 추론 및 코딩 에이전트 | Gemini 3.1 Pro | 최고 품질의 Gemini 추론, 다단계 도구 활용, 심층 코드 분석이 필요한 경우 | 비용이 높으므로 단순 작업에는 Flash를 사용하세요 |
| 멀티모달을 포함한 안정적 심층 추론 | Gemini 2.5 Pro | 광범위한 멀티모달 지원과 검증된 안정성의 프로덕션급 추론이 필요한 경우 | 3.1 Pro보다 성능 상한이 약간 낮음 |
| 저지연 멀티모달 앱 | Gemini 3 Flash | 텍스트, 이미지, 오디오, 비디오에 걸쳐 Gemini 3 세대 성능의 빠른 응답이 필요한 경우 | Preview 라우트 — 안정성 요구사항을 확인하세요 |
| 프로덕션 채팅 및 추출 | Gemini 2.5 Flash | 채팅, 요약, 대규모 추출에 검증된 프로덕션 워크호스가 필요한 경우 | 대부분의 프로덕션 워크로드에 적합한 기본 선택 |
| 최저가 대량 배치 텍스트 | Gemini 2.5 Flash Lite | 분류, 라우팅, 짧은 응답 등 비용이 가장 중요한 작업 | 텍스트 및 오디오 입력만 지원 |
| 복잡도가 혼재된 텍스트 워크플로 | EvoLink Smart Router | 같은 파이프라인에 Gemini와 다른 제공업체의 단순·복잡한 작업이 모두 있는 경우 | 수동 모델 라우팅 로직을 유지하고 싶지 않을 때 최적 |
Gemini API 워크플로: 에이전트, 채팅, 문서, 멀티모달 처리
실제 제품, 에이전트, 콘텐츠 처리 파이프라인에서 Gemini 모델이 어떻게 활용되는지 확인하세요.
추론 및 코딩 에이전트
코드 생성, 버그 수정, 다단계 도구 활용, 복잡한 분석 에이전트에 적합합니다. 출력 품질이 제품 동작에 직결된다면 Gemini 3.1 Pro로 시작하세요. 검증된 안정성이 필요하면 Gemini 2.5 Pro를 비교하세요.
프로덕션 채팅 및 고객 지원
고객 지원 봇, 인앱 어시스턴트, 지식 베이스 Q&A, 고빈도 멀티턴 대화에 적합합니다. 검증된 처리량의 Gemini 2.5 Flash로 먼저 테스트한 후, 비용 절감을 위해 Flash Lite를 비교하세요.
장문 문서 및 멀티모달 분석
PDF 분석, 비디오 이해, 오디오 전사, 다중 파일 연구 워크플로에 적합합니다. Gemini의 1M context window와 네이티브 멀티모달 지원으로 Pro 및 Flash 라우트가 강력한 선택입니다.
에이전트 라우팅 및 혼합 작업
분류, 추출, 추론, 생성이 같은 파이프라인에 공존하는 워크플로에 적합합니다. EvoLink Smart Router로 evolink/auto를 통해 Gemini와 다른 제공업체 간 자동 라우팅을 할 수 있습니다.
Gemini 모델 상세 보기
각 라우트는 가격, 사양, 통합 세부 정보가 있는 전용 모델 페이지로 연결됩니다.
Gemini 3.1 Pro Preview
플래그십 추론
- 컨텍스트 창
- 1M input / 64K output
- 가격
- $2/$12 <=200K; $4/$18 >200K
Gemini 3 Flash Preview
고속 Gemini 3
- 컨텍스트 창
- 1M input / 64K output
- 가격
- $0.50/$3.00 per MTok (audio in: $1.00)
Gemini 3.1 Flash Lite Preview
최저가 Gemini 3
- 컨텍스트 창
- 1M input / 64K output
- 가격
- $0.25/$1.50 per MTok (audio in: $0.50)
Gemini 2.5 Pro
안정 Pro
- 컨텍스트 창
- 1M input / 64K output
- 가격
- $1.25/$10 <=200K; $2.50/$15 >200K
Gemini 2.5 Flash
프로덕션 Flash
- 컨텍스트 창
- 1M input / 64K output
- 가격
- $0.30/$2.50 per MTok (audio in: $1.00)
Gemini 2.5 Flash Lite
최저 비용
- 컨텍스트 창
- 1M input / 64K output
- 가격
- $0.10/$0.40 per MTok (audio in: $0.30)
하나의 EvoLink API로 모든 Gemini 모델에 접근하세요
6개 Gemini 라우트를 하나의 EvoLink API 키와 OpenAI 호환 엔드포인트로 사용할 수 있습니다. model 파라미터만 변경하면 Pro, Flash, Lite 간에 자유롭게 전환할 수 있습니다 — 별도 계정이나 키가 필요 없습니다.
model="gemini-3.1-pro"를 model="gemini-2.5-flash"로 변경하기만 하면 됩니다. 통합 재구축이 필요 없습니다.Gemini API 비용 전략: Pro vs Flash vs Lite
Pro 라우트: 추론 품질이 프리미엄을 정당화합니다
Gemini 3.1 Pro와 2.5 Pro는 토큰당 비용이 높지만, 복잡한 코딩 에이전트, 심층 문서 분석, 다단계 도구 활용은 더 높은 가치의 출력을 생성합니다. 단순 추출이나 분류에는 Pro를 기본으로 사용하지 마세요.
Flash 라우트: 프로덕션 볼륨에 최적의 균형
Gemini 3 Flash와 2.5 Flash는 Pro 가격의 일부로 강력한 멀티모달 기능을 제공합니다. Pro를 검토하기 전에 채팅, 요약, 대규모 추출은 여기서 시작하세요.
Lite 라우트: 단순 대량 작업의 비용 최소화
Gemini 3.1 Flash Lite와 2.5 Flash Lite는 토큰당 최저 비용을 제공합니다. 추론 깊이가 중요하지 않은 분류, 라우팅, 배치 텍스트, 짧은 응답에 활용하세요.
가격 요약
Gemini 라우트는 입력 $0.10/MTok(Flash Lite)부터 $4.00/MTok(Pro >200K)까지 다양합니다. 모두 EvoLink을 통한 토큰당 과금 방식입니다.
Gemini 3.1 Pro
$2/$12 — $4/$18 /MTok
Context: 1M
1M context의 플래그십 추론. 단계별 가격: 200K 이하 $2/$12, 200K 초과 $4/$18.
Gemini 3 Flash
$0.50/$3.00 /MTok
Context: 1M
Gemini 3 세대 Flash 라우트, $0.50/$3.00 per MTok, 1M context.
Gemini 3.1 Flash Lite
$0.25/$1.50 /MTok
Context: 1M
배치 텍스트 워크로드용 가장 저렴한 Gemini 3 라우트, $0.25/$1.50 per MTok.
Gemini 2.5 Pro
$1.25/$10 — $2.50/$15 /MTok
Context: 1M
200K 이하 $1.25/$10, 200K 초과 $2.50/$15의 안정적 심층 추론.
Gemini 2.5 Flash
$0.30/$2.50 /MTok
Context: 1M
전체 멀티모달 지원의 프로덕션 워크호스, $0.30/$2.50 per MTok.
Gemini 2.5 Flash Lite
$0.10/$0.40 /MTok
Context: 1M
텍스트 및 오디오용 최저가 Gemini 라우트, $0.10/$0.40 per MTok.
Gemini 가이드 및 비교 자료
라우트를 결정하기 전에 더 자세한 정보가 필요하면 아래 가이드를 참고하세요.
Gemini 3.1 Pro vs GPT-5.2 vs Claude Opus
추론, 코딩, 프로덕션 에이전트 워크로드를 위한 플래그십 모델을 비교합니다.
GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro
최신 프리미엄 모델의 실용적인 API 선택 기준을 확인할 수 있습니다.
Gemini 3 Pro 지원 종료 마이그레이션 가이드
기존 Gemini 3 Pro Preview 트래픽을 프로덕션 동작을 유지하면서 현행 Gemini 라우트로 전환하는 방법을 안내합니다.
OpenCode와 Gemini 라우트 통합
EvoLink의 통합 API 레이어를 통해 Gemini를 Claude, GPT 모델과 함께 사용하는 방법을 소개합니다.
Gemini API FAQ
Everything you need to know about the product and billing.