HappyHorse 1.0 정식 출시지금 사용하기
Gemini API Family

Gemini API Family

EvoLink의 Gemini 라우트를 한 페이지에서 비교하세요. 플래그십 추론, 저지연 Flash, 긴 컨텍스트 작업, 멀티모달 이해를 함께 볼 수 있습니다.

Gemini API 라우트 비교

워크로드에 맞게 선택하세요: 플래그십 추론, 프로덕션 Flash 트래픽, 저비용 추출, 긴 컨텍스트 멀티모달 분석.

라우트적합한 작업가격컨텍스트 창모달리티상태
Gemini 3.1 Pro Preview

플래그십 추론

최고 품질의 Gemini 추론, 코딩, 에이전트, 긴 컨텍스트 분석.$2/$12 <=200K; $4/$18 >200K1M input / 64K output텍스트, 코드, 이미지, 비디오, 오디오, PDF 입력Preview flagship
Gemini 3 Flash Preview

고속 Gemini 3

Gemini 3 성능과 낮은 지연 시간이 필요한 멀티모달 앱.$0.50/$3.00 per MTok (audio in: $1.00)1M input / 64K output텍스트, 이미지, 비디오, 오디오, PDF 입력Preview route
대량 번역, 분류, 추출, 텍스트 배치 처리 작업.$0.25/$1.50 per MTok (audio in: $0.50)1M input / 64K output텍스트, 이미지, 비디오, 오디오, PDF 입력Preview route
Gemini 2.5 Pro

안정 Pro

프로덕션 추론, 코딩 지원, 분석, 복잡한 멀티모달 작업.$1.25/$10 <=200K; $2.50/$15 >200K1M input / 64K output텍스트, 이미지, 비디오, 오디오, PDF 입력Stable deep reasoning
Gemini 2.5 Flash

프로덕션 Flash

빠른 채팅, 추출, 요약, 멀티모달 프로덕션 트래픽.$0.30/$2.50 per MTok (audio in: $1.00)1M input / 64K output텍스트, 이미지, 비디오, 오디오, PDF 입력Production workhorse
대량 분류, 추출, 라우팅, 가벼운 채팅 플로우.$0.10/$0.40 per MTok (audio in: $0.30)1M input / 64K output텍스트 및 오디오 입력Lowest-cost text route

Gemini 모델 선택 가이드: Pro, Flash, Lite 4가지 판단 기준

아래 4가지 기준으로 Pro, Flash, Lite 중 최적 모델을 찾아보세요.

1

먼저 추론 깊이를 확인하세요

복잡한 코딩 에이전트, 다단계 도구 활용, 심층 문서 분석, 고정밀 출력이 필요하다면 Gemini 3.1 Pro 또는 Gemini 2.5 Pro부터 시작하세요.

2

그다음 지연 시간과 처리량을 확인하세요

프로덕션 채팅, 고객 지원 봇, 실시간 추출, 고빈도 멀티모달 앱이라면 Gemini 3 Flash 또는 Gemini 2.5 Flash를 비교하세요.

3

그다음 비용 민감도를 확인하세요

대량 분류, 배치 텍스트 처리, 라우팅, 경량 추출이 주 작업이라면 Gemini 3.1 Flash Lite 또는 Gemini 2.5 Flash Lite를 비교하세요.

4

마지막으로 복잡도가 혼재된 워크플로를 검토하세요

같은 파이프라인에 단순 분류와 심층 추론이 혼재한다면, 하나의 Gemini 모델을 고정하는 대신 EvoLink Smart Router를 검토하세요.

Smart Router →

이미 작업 유형을 알고 계시다면, 아래 표에서 권장 시작점을 찾아보세요.

워크플로별 Gemini 모델 선택: 추론, 속도, 비용, 멀티모달

주요 작업을 기준으로 적합한 Gemini 라우트를 선택하세요.

작업 유형권장 시작 모델적합한 경우주의사항
복잡한 추론 및 코딩 에이전트Gemini 3.1 Pro최고 품질의 Gemini 추론, 다단계 도구 활용, 심층 코드 분석이 필요한 경우비용이 높으므로 단순 작업에는 Flash를 사용하세요
멀티모달을 포함한 안정적 심층 추론Gemini 2.5 Pro광범위한 멀티모달 지원과 검증된 안정성의 프로덕션급 추론이 필요한 경우3.1 Pro보다 성능 상한이 약간 낮음
저지연 멀티모달 앱Gemini 3 Flash텍스트, 이미지, 오디오, 비디오에 걸쳐 Gemini 3 세대 성능의 빠른 응답이 필요한 경우Preview 라우트 — 안정성 요구사항을 확인하세요
프로덕션 채팅 및 추출Gemini 2.5 Flash채팅, 요약, 대규모 추출에 검증된 프로덕션 워크호스가 필요한 경우대부분의 프로덕션 워크로드에 적합한 기본 선택
최저가 대량 배치 텍스트Gemini 2.5 Flash Lite분류, 라우팅, 짧은 응답 등 비용이 가장 중요한 작업텍스트 및 오디오 입력만 지원
복잡도가 혼재된 텍스트 워크플로EvoLink Smart Router같은 파이프라인에 Gemini와 다른 제공업체의 단순·복잡한 작업이 모두 있는 경우수동 모델 라우팅 로직을 유지하고 싶지 않을 때 최적

Gemini API 워크플로: 에이전트, 채팅, 문서, 멀티모달 처리

실제 제품, 에이전트, 콘텐츠 처리 파이프라인에서 Gemini 모델이 어떻게 활용되는지 확인하세요.

추론 및 코딩 에이전트

코드 생성, 버그 수정, 다단계 도구 활용, 복잡한 분석 에이전트에 적합합니다. 출력 품질이 제품 동작에 직결된다면 Gemini 3.1 Pro로 시작하세요. 검증된 안정성이 필요하면 Gemini 2.5 Pro를 비교하세요.

프로덕션 채팅 및 고객 지원

고객 지원 봇, 인앱 어시스턴트, 지식 베이스 Q&A, 고빈도 멀티턴 대화에 적합합니다. 검증된 처리량의 Gemini 2.5 Flash로 먼저 테스트한 후, 비용 절감을 위해 Flash Lite를 비교하세요.

장문 문서 및 멀티모달 분석

PDF 분석, 비디오 이해, 오디오 전사, 다중 파일 연구 워크플로에 적합합니다. Gemini의 1M context window와 네이티브 멀티모달 지원으로 Pro 및 Flash 라우트가 강력한 선택입니다.

에이전트 라우팅 및 혼합 작업

분류, 추출, 추론, 생성이 같은 파이프라인에 공존하는 워크플로에 적합합니다. EvoLink Smart Router로 evolink/auto를 통해 Gemini와 다른 제공업체 간 자동 라우팅을 할 수 있습니다.

Gemini 모델 상세 보기

각 라우트는 가격, 사양, 통합 세부 정보가 있는 전용 모델 페이지로 연결됩니다.

하나의 EvoLink API로 모든 Gemini 모델에 접근하세요

6개 Gemini 라우트를 하나의 EvoLink API 키와 OpenAI 호환 엔드포인트로 사용할 수 있습니다. model 파라미터만 변경하면 Pro, Flash, Lite 간에 자유롭게 전환할 수 있습니다 — 별도 계정이나 키가 필요 없습니다.

model="gemini-3.1-pro"를 model="gemini-2.5-flash"로 변경하기만 하면 됩니다. 통합 재구축이 필요 없습니다.
모든 Gemini 모델용 단일 API 키
OpenAI 호환 엔드포인트
model 파라미터 변경만으로 모델 전환
통합 과금 및 사용량 확인

Gemini API 비용 전략: Pro vs Flash vs Lite

Pro 라우트: 추론 품질이 프리미엄을 정당화합니다

Gemini 3.1 Pro와 2.5 Pro는 토큰당 비용이 높지만, 복잡한 코딩 에이전트, 심층 문서 분석, 다단계 도구 활용은 더 높은 가치의 출력을 생성합니다. 단순 추출이나 분류에는 Pro를 기본으로 사용하지 마세요.

Flash 라우트: 프로덕션 볼륨에 최적의 균형

Gemini 3 Flash와 2.5 Flash는 Pro 가격의 일부로 강력한 멀티모달 기능을 제공합니다. Pro를 검토하기 전에 채팅, 요약, 대규모 추출은 여기서 시작하세요.

Lite 라우트: 단순 대량 작업의 비용 최소화

Gemini 3.1 Flash Lite와 2.5 Flash Lite는 토큰당 최저 비용을 제공합니다. 추론 깊이가 중요하지 않은 분류, 라우팅, 배치 텍스트, 짧은 응답에 활용하세요.

가격 요약

Gemini 라우트는 입력 $0.10/MTok(Flash Lite)부터 $4.00/MTok(Pro >200K)까지 다양합니다. 모두 EvoLink을 통한 토큰당 과금 방식입니다.

Gemini 3.1 Pro

$2/$12 — $4/$18 /MTok

Context: 1M

1M context의 플래그십 추론. 단계별 가격: 200K 이하 $2/$12, 200K 초과 $4/$18.

Gemini 3 Flash

$0.50/$3.00 /MTok

Context: 1M

Gemini 3 세대 Flash 라우트, $0.50/$3.00 per MTok, 1M context.

Gemini 3.1 Flash Lite

$0.25/$1.50 /MTok

Context: 1M

배치 텍스트 워크로드용 가장 저렴한 Gemini 3 라우트, $0.25/$1.50 per MTok.

Gemini 2.5 Pro

$1.25/$10 — $2.50/$15 /MTok

Context: 1M

200K 이하 $1.25/$10, 200K 초과 $2.50/$15의 안정적 심층 추론.

Gemini 2.5 Flash

$0.30/$2.50 /MTok

Context: 1M

전체 멀티모달 지원의 프로덕션 워크호스, $0.30/$2.50 per MTok.

Gemini 2.5 Flash Lite

$0.10/$0.40 /MTok

Context: 1M

텍스트 및 오디오용 최저가 Gemini 라우트, $0.10/$0.40 per MTok.

Gemini 가이드 및 비교 자료

라우트를 결정하기 전에 더 자세한 정보가 필요하면 아래 가이드를 참고하세요.

Gemini API FAQ

Everything you need to know about the product and billing.

최고 추론 품질이 필요하면 Gemini 3.1 Pro, 안정적인 심층 추론에는 Gemini 2.5 Pro, 빠른 프로덕션 워크로드에는 Gemini 2.5 Flash, 비용이 가장 중요한 제약이면 Flash Lite부터 시작하세요.
네. 여러 Gemini 라우트가 매우 큰 context window를 지원하므로 PDF 분석, 문서 검토, 검색 워크플로, 다중 파일 추론에 유용합니다.
응답 품질, 코딩, 다단계 추론이 가장 중요하면 Pro를 선택하세요. 속도, 프로덕션 처리량, 예측 가능한 비용이 더 중요하면 Flash를 선택하세요.
EvoLink은 Gemini 3.1 Pro, Gemini 3 Flash Preview, Gemini 3.1 Flash Lite Preview, Gemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.5 Flash Lite에 대한 접근을 제공합니다. 6개 모두 하나의 API 키와 OpenAI 호환 엔드포인트를 통해 사용할 수 있습니다.
Gemini 2.5 Flash Lite가 $0.10/$0.40 per 1M tokens(입력/출력)으로 최저가 Gemini 라우트입니다. Gemini 3 세대에서는 Flash Lite가 $0.25/$1.50 per MTok으로 가장 저렴합니다.
네. EvoLink은 모든 Gemini 모델은 물론 GPT, Claude 및 200개 이상의 다른 모델을 위한 단일 API 키를 제공합니다. 모델 파라미터만 변경하면 모델 간 전환이 가능합니다 — 별도의 계정이나 키가 필요 없습니다.