Gemini 3 플래시 미리보기 API
OpenAI SDK 호환성 및 기본 Gemini API 지원을 통해 EvoLink을 통해 Google의 Gemini 3 Flash 미리보기(gemini-3-flash-preview)에 액세스하세요. 1,048,576개의 토큰 컨텍스트 창과 프로덕션 워크로드를 위한 캐싱 및 배치 옵션을 사용하여 텍스트, 이미지, 비디오, 오디오 및 PDF 입력을 보냅니다.
PRICING
| PLAN | CONTEXT WINDOW | MAX OUTPUT | INPUT | OUTPUT | CACHE READ |
|---|---|---|---|---|---|
| Gemini 3 Flash | 1.05M | 65.5K | ≤200.0K$0.400-20% $0.500Official Price >200.0K$0.400-20% $0.500Official Price | ≤200.0K$2.40-20% $3.00Official Price >200.0K$2.40-20% $3.00Official Price | ≤200.0K$0.040-19% $0.050Official Price >200.0K$0.040-19% $0.050Official Price |
| Gemini 3 Flash (Beta) | 1.05M | 65.5K | ≤200.0K$0.130-74% $0.500Official Price >200.0K$0.130-74% $0.500Official Price | ≤200.0K$0.780-74% $3.00Official Price >200.0K$0.780-74% $3.00Official Price | ≤200.0K$0.013-74% $0.050Official Price >200.0K$0.013-74% $0.050Official Price |
Pricing Note: Price unit: USD / 1M tokens
Cache Hit: Price applies to cached prompt tokens.
Two ways to run Gemini 3 Flash — pick the tier that matches your workload.
- · Gemini 3 Flash: the default tier for production reliability and predictable availability.
- · Gemini 3 Flash (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.
Gemini 3 플래시 미리보기 EvoLink의 API
속도와 규모를 고려하여 제작된 Gemini 3 Flash Preview는 텍스트, 이미지, 비디오, 오디오 및 PDF를 이해하고 대규모 컨텍스트(최대 100만 개 토큰)를 처리합니다. 실시간 도우미, 문서 이해, 미디어 분석에 대한 명확하고 신뢰할 수 있는 답변을 제공합니다.

Gemini 3 Flash 미리보기로 구축할 수 있는 것
다중 모드 입력, 안정적인 텍스트 출력
단일 요청에는 텍스트, 이미지, 비디오, 오디오 또는 PDF가 포함될 수 있으며 텍스트 출력이 반환될 수 있습니다. 이를 통해 별도의 파이프라인 없이 쉽게 회의를 요약하고, 미디어를 검토하고, 구조화된 통찰력을 추출할 수 있습니다.

긴 세션을 위한 1M-토큰 컨텍스트
단일 요청으로 최대 1,048,576개의 입력 토큰과 65,536개의 출력 토큰을 처리합니다. 이를 통해 긴 문서, 코드베이스 또는 여러 차례의 채팅을 하나의 일관된 컨텍스트로 유지할 수 있습니다.

도구, 접지 및 추론
함수 호출, 코드 실행, 파일 검색, 검색 기반 및 URL 컨텍스트를 통해 사고 및 구조화된 출력을 사용합니다. 규모와 비용 제어를 위해 일괄 API 및 캐싱이 지원됩니다.

Gemini 3 플래시 미리보기에 EvoLink을 사용하는 이유
공식 Gemini 기능과 가격을 사용하여 OpenAI SDK 형식 또는 Google 기본 API 형식을 통해 gemini-3-flash-preview를 실행하세요.
하나의 통합, 두 가지 형식
앱 로직을 변경하지 않고 OpenAI SDK 또는 기본 Gemini 형식으로 Gemini 3 Flash 미리보기를 호출하세요.
배치 + 캐싱 비용 절감
일괄 처리 및 컨텍스트 캐싱을 사용하여 반복 비용을 낮추는 동시에 대용량 워크로드를 안전하게 확장합니다.
프로덕션 사용 준비 완료
다중 모드 입력, 긴 컨텍스트 및 도구 지원은 실제 생산 보조, 분석 및 자동화 워크플로우를 포괄합니다.
Gemini 3 플래시 미리보기를 호출하는 방법
OpenAI SDK 또는 Google 기본 API 형식을 선택한 다음 요청을 보내세요.
1단계 - API 형식 선택
OpenAI SDK 형식: POST /v1/chat/completions(모델 "gemini-3-flash-preview" 포함). 기본 API 형식: generateContent 또는 streamGenerateContent 메소드를 사용하는 POST /v1beta/models/gemini-3-flash-preview:{method}.
2단계 - 인증 및 입력 추가
승인 포함: 전달자 <token>. 텍스트 또는 다중 모드 부분(이미지, 비디오, 오디오, PDF)이 포함된 메시지/콘텐츠를 보냅니다.
3단계 - 스트리밍 또는 규모 조정
실시간 UX용 스트리밍을 활성화하거나 X-Async-Mode를 사용하여 작업 ID를 반환합니다. 비용 효율적인 대용량 실행을 위해 배치와 캐싱을 결합합니다.
기술 사양
gemini-3-flash-preview의 공식 모델 기능
1,048,576개의 입력 토큰
최대 1,048,576개의 입력 토큰과 65,536개의 출력 토큰.
다중 모드 입력
텍스트 출력을 포함한 텍스트, 이미지, 비디오, 오디오 및 PDF 입력.
사고 + 구조화된 출력
신뢰할 수 있고 기계 판독이 가능한 결과를 위해 사고적이고 구조화된 출력이 지원됩니다.
함수 호출 + 도구
함수 호출, 코드 실행, 파일 검색이 지원됩니다.
캐싱 + 배치
반복적이거나 대규모 워크로드에 대해 컨텍스트 캐싱 및 배치 API이 지원됩니다.
검색 접지 + URL 컨텍스트
검색 접지 및 URL 컨텍스트가 지원됩니다(Google 지도 접지는 지원되지 않음).
Gemini 3 플래시 미리보기 API FAQ
Everything you need to know about the product and billing.