Gemini 모델 비교: Pro, Flash & Lite API 가격

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Gemini API Family

EvoLink의 Gemini 라우트를 한 페이지에서 비교하세요. 플래그십 추론, 저지연 Flash, 긴 컨텍스트 작업, 멀티모달 이해를 함께 볼 수 있습니다.

API 문서 보기 가격 보기

📦

7개 라우트

모든 예산에 맞는 Pro, Flash, Lite 티어

🔗

통합 API 접근

OpenAI 호환, 하나의 키로 모든 Gemini

🎯

워크플로별 선택

Pro vs Flash vs Lite를 작업에 매칭하세요

모델 비교 선택 가이드 활용 사례 통합 접근 FAQ

Gemini API 라우트 비교

워크로드에 맞게 선택하세요: 플래그십 추론, 프로덕션 Flash 트래픽, 저비용 추출, 긴 컨텍스트 멀티모달 분석.

라우트	적합한 작업	가격	컨텍스트 창	모달리티	상태
Gemini 3.1 Pro Preview 플래그십 추론	최고 품질의 Gemini 추론, 코딩, 에이전트, 긴 컨텍스트 분석.	$2/$12 <=200K; $4/$18 >200K	1M input / 64K output	텍스트, 코드, 이미지, 비디오, 오디오, PDF 입력	Preview flagship
Gemini 3.5 Flash 안정 — 프로덕션용 GA	에이전틱 워크플로, 코딩 에이전트, 서브 에이전트 배포, Flash 수준 비용의 장기 프로덕션 작업.	$1.50/$9.00 per MTok	1M input / 65K output	텍스트, 이미지, 비디오, 오디오, PDF 입력	Stable (GA)
Gemini 3 Flash Preview 고속 Gemini 3	Gemini 3 성능과 낮은 지연 시간이 필요한 멀티모달 앱.	$0.50/$3.00 per MTok (audio in: $1.00)	1M input / 64K output	텍스트, 이미지, 비디오, 오디오, PDF 입력	Preview route
Gemini 3.1 Flash Lite Preview 최저가 Gemini 3	대량 번역, 분류, 추출, 텍스트 배치 처리 작업.	$0.25/$1.50 per MTok (audio in: $0.50)	1M input / 64K output	텍스트, 이미지, 비디오, 오디오, PDF 입력	Preview route
Gemini 2.5 Pro 안정 Pro	프로덕션 추론, 코딩 지원, 분석, 복잡한 멀티모달 작업.	$1.25/$10 <=200K; $2.50/$15 >200K	1M input / 64K output	텍스트, 이미지, 비디오, 오디오, PDF 입력	Stable deep reasoning
Gemini 2.5 Flash 프로덕션 Flash	빠른 채팅, 추출, 요약, 멀티모달 프로덕션 트래픽.	$0.30/$2.50 per MTok (audio in: $1.00)	1M input / 64K output	텍스트, 이미지, 비디오, 오디오, PDF 입력	Production workhorse
Gemini 2.5 Flash Lite 최저 비용	대량 분류, 추출, 라우팅, 가벼운 채팅 플로우.	$0.10/$0.40 per MTok (audio in: $0.30)	1M input / 64K output	텍스트 및 오디오 입력	Lowest-cost text route

Gemini 모델 선택 가이드: Pro, Flash, Lite 4가지 판단 기준

아래 4가지 기준으로 Pro, Flash, Lite 중 최적 모델을 찾아보세요.

먼저 추론 깊이를 확인하세요

복잡한 코딩 에이전트, 다단계 도구 활용, 심층 문서 분석, 고정밀 출력이 필요하다면 Gemini 3.1 Pro 또는 Gemini 2.5 Pro부터 시작하세요.

그다음 지연 시간과 처리량을 확인하세요

프로덕션 채팅, 고객 지원 봇, 실시간 추출, 고빈도 멀티모달 앱이라면 Gemini 3 Flash 또는 Gemini 2.5 Flash를 비교하세요.

그다음 비용 민감도를 확인하세요

대량 분류, 배치 텍스트 처리, 라우팅, 경량 추출이 주 작업이라면 Gemini 3.1 Flash Lite 또는 Gemini 2.5 Flash Lite를 비교하세요.

마지막으로 복잡도가 혼재된 워크플로를 검토하세요

같은 파이프라인에 단순 분류와 심층 추론이 혼재한다면, 하나의 Gemini 모델을 고정하는 대신 EvoLink Smart Router를 검토하세요.

Smart Router →

이미 작업 유형을 알고 계시다면, 아래 표에서 권장 시작점을 찾아보세요.

워크플로별 Gemini 모델 선택: 추론, 속도, 비용, 멀티모달

주요 작업을 기준으로 적합한 Gemini 라우트를 선택하세요.

작업 유형	권장 시작 모델	적합한 경우	주의사항
복잡한 추론 및 코딩 에이전트	Gemini 3.1 Pro	최고 품질의 Gemini 추론, 다단계 도구 활용, 심층 코드 분석이 필요한 경우	비용이 높으므로 단순 작업에는 Flash를 사용하세요
멀티모달을 포함한 안정적 심층 추론	Gemini 2.5 Pro	광범위한 멀티모달 지원과 검증된 안정성의 프로덕션급 추론이 필요한 경우	3.1 Pro보다 성능 상한이 약간 낮음
에이전틱 워크플로 및 코딩 에이전트	Gemini 3.5 Flash	코딩 에이전트, 서브 에이전트 루프, 장기 작업을 위해 Flash 수준 비용으로 프론티어급 지능이 필요한 경우	GA 및 안정 — 에이전트 워크로드용 기본 Flash
저지연 멀티모달 앱	Gemini 3 Flash	텍스트, 이미지, 오디오, 비디오에 걸쳐 Gemini 3 세대 성능의 빠른 응답이 필요한 경우	Preview 라우트 — 안정성 요구사항을 확인하세요
프로덕션 채팅 및 추출	Gemini 2.5 Flash	채팅, 요약, 대규모 추출에 검증된 프로덕션 워크호스가 필요한 경우	대부분의 프로덕션 워크로드에 적합한 기본 선택
최저가 대량 배치 텍스트	Gemini 2.5 Flash Lite	분류, 라우팅, 짧은 응답 등 비용이 가장 중요한 작업	텍스트 및 오디오 입력만 지원
복잡도가 혼재된 텍스트 워크플로	EvoLink Smart Router	같은 파이프라인에 Gemini와 다른 제공업체의 단순·복잡한 작업이 모두 있는 경우	수동 모델 라우팅 로직을 유지하고 싶지 않을 때 최적

Gemini API 워크플로: 에이전트, 채팅, 문서, 멀티모달 처리

실제 제품, 에이전트, 콘텐츠 처리 파이프라인에서 Gemini 모델이 어떻게 활용되는지 확인하세요.

추론 및 코딩 에이전트

코드 생성, 버그 수정, 다단계 도구 활용, 복잡한 분석 에이전트에 적합합니다. 출력 품질이 제품 동작에 직결된다면 Gemini 3.1 Pro로 시작하세요. 검증된 안정성이 필요하면 Gemini 2.5 Pro를 비교하세요.

Gemini 3.1 Pro 보기 →

프로덕션 채팅 및 고객 지원

고객 지원 봇, 인앱 어시스턴트, 지식 베이스 Q&A, 고빈도 멀티턴 대화에 적합합니다. 검증된 처리량의 Gemini 2.5 Flash로 먼저 테스트한 후, 비용 절감을 위해 Flash Lite를 비교하세요.

Gemini 2.5 Flash 보기 →

장문 문서 및 멀티모달 분석

PDF 분석, 비디오 이해, 오디오 전사, 다중 파일 연구 워크플로에 적합합니다. Gemini의 1M context window와 네이티브 멀티모달 지원으로 Pro 및 Flash 라우트가 강력한 선택입니다.

Gemini 2.5 Pro 보기 →

에이전트 라우팅 및 혼합 작업

분류, 추출, 추론, 생성이 같은 파이프라인에 공존하는 워크플로에 적합합니다. EvoLink Smart Router로 evolink/auto를 통해 Gemini와 다른 제공업체 간 자동 라우팅을 할 수 있습니다.

Smart Router 보기 →

Gemini 모델 상세 보기

각 라우트는 가격, 사양, 통합 세부 정보가 있는 전용 모델 페이지로 연결됩니다.

Gemini 3.1 Pro Preview

플래그십 추론

컨텍스트 창: 1M input / 64K output
가격: $2/$12 <=200K; $4/$18 >200K

보기 Gemini 3.1 Pro Preview →

Gemini 3.5 Flash

안정 — 프로덕션용 GA

컨텍스트 창: 1M input / 65K output
가격: $1.50/$9.00 per MTok

보기 Gemini 3.5 Flash →

Gemini 3 Flash Preview

고속 Gemini 3

컨텍스트 창: 1M input / 64K output
가격: $0.50/$3.00 per MTok (audio in: $1.00)

보기 Gemini 3 Flash Preview →

Gemini 3.1 Flash Lite Preview

최저가 Gemini 3

컨텍스트 창: 1M input / 64K output
가격: $0.25/$1.50 per MTok (audio in: $0.50)

보기 Gemini 3.1 Flash Lite Preview →

Gemini 2.5 Pro

안정 Pro

컨텍스트 창: 1M input / 64K output
가격: $1.25/$10 <=200K; $2.50/$15 >200K

보기 Gemini 2.5 Pro →

Gemini 2.5 Flash

프로덕션 Flash

컨텍스트 창: 1M input / 64K output
가격: $0.30/$2.50 per MTok (audio in: $1.00)

보기 Gemini 2.5 Flash →

Gemini 2.5 Flash Lite

최저 비용

컨텍스트 창: 1M input / 64K output
가격: $0.10/$0.40 per MTok (audio in: $0.30)

보기 Gemini 2.5 Flash Lite →

하나의 EvoLink API로 모든 Gemini 모델에 접근하세요

7개 Gemini 라우트를 하나의 EvoLink API 키와 OpenAI 호환 엔드포인트로 사용할 수 있습니다. model 파라미터만 변경하면 Pro, Flash, Lite 간에 자유롭게 전환할 수 있습니다 — 별도 계정이나 키가 필요 없습니다.

model="gemini-3.1-pro"를 model="gemini-2.5-flash"로 변경하기만 하면 됩니다. 통합 재구축이 필요 없습니다.

모든 Gemini 모델용 단일 API 키

OpenAI 호환 엔드포인트

model 파라미터 변경만으로 모델 전환

통합 과금 및 사용량 확인

API 문서 보기 API 키 생성 가격 보기

Gemini API 비용 전략: Pro vs Flash vs Lite

Pro 라우트: 추론 품질이 프리미엄을 정당화합니다

Gemini 3.1 Pro와 2.5 Pro는 토큰당 비용이 높지만, 복잡한 코딩 에이전트, 심층 문서 분석, 다단계 도구 활용은 더 높은 가치의 출력을 생성합니다. 단순 추출이나 분류에는 Pro를 기본으로 사용하지 마세요.

Flash 라우트: 프로덕션 볼륨에 최적의 균형

Gemini 3 Flash와 2.5 Flash는 Pro 가격의 일부로 강력한 멀티모달 기능을 제공합니다. Pro를 검토하기 전에 채팅, 요약, 대규모 추출은 여기서 시작하세요.

Lite 라우트: 단순 대량 작업의 비용 최소화

Gemini 3.1 Flash Lite와 2.5 Flash Lite는 토큰당 최저 비용을 제공합니다. 추론 깊이가 중요하지 않은 분류, 라우팅, 배치 텍스트, 짧은 응답에 활용하세요.

전체 가격 보기 →

가격 요약

Gemini 라우트는 입력 $0.10/MTok(Flash Lite)부터 $4.00/MTok(Pro >200K)까지 다양합니다. 모두 EvoLink을 통한 토큰당 과금 방식입니다.

Gemini 3.1 Pro

$2/$12 — $4/$18 /MTok

Context: 1M

1M context의 플래그십 추론. 단계별 가격: 200K 이하 $2/$12, 200K 초과 $4/$18.

Gemini 3.5 Flash

$1.50/$9.00 /MTok

Context: 1M

에이전틱 워크플로와 코딩을 위한 GA 안정 Flash, $1.50/$9.00 per MTok, 1M context, 내장 추론.

Gemini 3 Flash

$0.50/$3.00 /MTok

Context: 1M

Gemini 3 세대 Flash 라우트, $0.50/$3.00 per MTok, 1M context.

Gemini 3.1 Flash Lite

$0.25/$1.50 /MTok

Context: 1M

배치 텍스트 워크로드용 가장 저렴한 Gemini 3 라우트, $0.25/$1.50 per MTok.

Gemini 2.5 Pro

$1.25/$10 — $2.50/$15 /MTok

Context: 1M

200K 이하 $1.25/$10, 200K 초과 $2.50/$15의 안정적 심층 추론.

Gemini 2.5 Flash

$0.30/$2.50 /MTok

Context: 1M

전체 멀티모달 지원의 프로덕션 워크호스, $0.30/$2.50 per MTok.

Gemini 2.5 Flash Lite

$0.10/$0.40 /MTok

Context: 1M

텍스트 및 오디오용 최저가 Gemini 라우트, $0.10/$0.40 per MTok.

Gemini 가이드 및 비교 자료

라우트를 결정하기 전에 더 자세한 정보가 필요하면 아래 가이드를 참고하세요.

Gemini 3.1 Pro vs GPT-5.2 vs Claude Opus

추론, 코딩, 프로덕션 에이전트 워크로드를 위한 플래그십 모델을 비교합니다.

GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro

최신 프리미엄 모델의 실용적인 API 선택 기준을 확인할 수 있습니다.

Gemini 3 Pro 지원 종료 마이그레이션 가이드

기존 Gemini 3 Pro Preview 트래픽을 프로덕션 동작을 유지하면서 현행 Gemini 라우트로 전환하는 방법을 안내합니다.

OpenCode와 Gemini 라우트 통합

EvoLink의 통합 API 레이어를 통해 Gemini를 Claude, GPT 모델과 함께 사용하는 방법을 소개합니다.

Gemini API FAQ

Everything you need to know about the product and billing.

최고 추론 품질이 필요하면 Gemini 3.1 Pro, 에이전틱 워크플로와 코딩 에이전트에는 Gemini 3.5 Flash, 안정적인 심층 추론에는 Gemini 2.5 Pro, 빠른 프로덕션 워크로드에는 Gemini 2.5 Flash, 비용이 가장 중요한 제약이면 Flash Lite부터 시작하세요.

네. 여러 Gemini 라우트가 매우 큰 context window를 지원하므로 PDF 분석, 문서 검토, 검색 워크플로, 다중 파일 추론에 유용합니다.

응답 품질, 코딩, 다단계 추론이 가장 중요하면 Pro를 선택하세요. 속도, 프로덕션 처리량, 예측 가능한 비용이 더 중요하면 Flash를 선택하세요.

EvoLink은 Gemini 3.1 Pro, Gemini 3.5 Flash, Gemini 3 Flash Preview, Gemini 3.1 Flash Lite Preview, Gemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.5 Flash Lite에 대한 접근을 제공합니다. 7개 모두 하나의 API 키와 OpenAI 호환 엔드포인트를 통해 사용할 수 있습니다.

Gemini 2.5 Flash Lite가 $0.10/$0.40 per 1M tokens(입력/출력)으로 최저가 Gemini 라우트입니다. Gemini 3 세대에서는 Flash Lite가 $0.25/$1.50 per MTok으로 가장 저렴합니다.

네. EvoLink은 모든 Gemini 모델은 물론 GPT, Claude 및 200개 이상의 다른 모델을 위한 단일 API 키를 제공합니다. 모델 파라미터만 변경하면 모델 간 전환이 가능합니다 — 별도의 계정이나 키가 필요 없습니다.