Seedance 2.0 API — Coming SoonGet early access

Gemini 3 플래시 미리보기 API

OpenAI SDK 호환성 및 기본 Gemini API 지원을 통해 EvoLink을 통해 Google의 Gemini 3 Flash 미리보기(gemini-3-flash-preview)에 액세스하세요. 1,048,576개의 토큰 컨텍스트 창과 프로덕션 워크로드를 위한 캐싱 및 배치 옵션을 사용하여 텍스트, 이미지, 비디오, 오디오 및 PDF 입력을 보냅니다.

Run With API
Using coding CLIs? Run Gemini 3 Flash via EvoCode — One API for Code Agents & CLIs. (View Docs)
$

PRICING

PLANCONTEXT WINDOWMAX OUTPUTINPUTOUTPUTCACHE READ
Gemini 3 Flash1.05M65.5K
200.0K$0.400-20%
$0.500Official Price
>200.0K$0.400-20%
$0.500Official Price
200.0K$2.40-20%
$3.00Official Price
>200.0K$2.40-20%
$3.00Official Price
200.0K$0.040-19%
$0.050Official Price
>200.0K$0.040-19%
$0.050Official Price
Gemini 3 Flash (Beta)1.05M65.5K
200.0K$0.130-74%
$0.500Official Price
>200.0K$0.130-74%
$0.500Official Price
200.0K$0.780-74%
$3.00Official Price
>200.0K$0.780-74%
$3.00Official Price
200.0K$0.013-74%
$0.050Official Price
>200.0K$0.013-74%
$0.050Official Price

Pricing Note: Price unit: USD / 1M tokens

Cache Hit: Price applies to cached prompt tokens.

Two ways to run Gemini 3 Flash — pick the tier that matches your workload.

  • · Gemini 3 Flash: the default tier for production reliability and predictable availability.
  • · Gemini 3 Flash (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.

Gemini 3 플래시 미리보기 EvoLink의 API

속도와 규모를 고려하여 제작된 Gemini 3 Flash Preview는 텍스트, 이미지, 비디오, 오디오 및 PDF를 이해하고 대규모 컨텍스트(최대 100만 개 토큰)를 처리합니다. 실시간 도우미, 문서 이해, 미디어 분석에 대한 명확하고 신뢰할 수 있는 답변을 제공합니다.

Gemini 3 플래시 미리보기 API

Gemini 3 Flash 미리보기로 구축할 수 있는 것

다중 모드 입력, 안정적인 텍스트 출력

단일 요청에는 텍스트, 이미지, 비디오, 오디오 또는 PDF가 포함될 수 있으며 텍스트 출력이 반환될 수 있습니다. 이를 통해 별도의 파이프라인 없이 쉽게 회의를 요약하고, 미디어를 검토하고, 구조화된 통찰력을 추출할 수 있습니다.

다중 모드 입력

긴 세션을 위한 1M-토큰 컨텍스트

단일 요청으로 최대 1,048,576개의 입력 토큰과 65,536개의 출력 토큰을 처리합니다. 이를 통해 긴 문서, 코드베이스 또는 여러 차례의 채팅을 하나의 일관된 컨텍스트로 유지할 수 있습니다.

긴 컨텍스트

도구, 접지 및 추론

함수 호출, 코드 실행, 파일 검색, 검색 기반 및 URL 컨텍스트를 통해 사고 및 구조화된 출력을 사용합니다. 규모와 비용 제어를 위해 일괄 API 및 캐싱이 지원됩니다.

압형

Gemini 3 플래시 미리보기에 EvoLink을 사용하는 이유

공식 Gemini 기능과 가격을 사용하여 OpenAI SDK 형식 또는 Google 기본 API 형식을 통해 gemini-3-flash-preview를 실행하세요.

하나의 통합, 두 가지 형식

앱 로직을 변경하지 않고 OpenAI SDK 또는 기본 Gemini 형식으로 Gemini 3 Flash 미리보기를 호출하세요.

배치 + 캐싱 비용 절감

일괄 처리 및 컨텍스트 캐싱을 사용하여 반복 비용을 낮추는 동시에 대용량 워크로드를 안전하게 확장합니다.

프로덕션 사용 준비 완료

다중 모드 입력, 긴 컨텍스트 및 도구 지원은 실제 생산 보조, 분석 및 자동화 워크플로우를 포괄합니다.

Gemini 3 플래시 미리보기를 호출하는 방법

OpenAI SDK 또는 Google 기본 API 형식을 선택한 다음 요청을 보내세요.

1

1단계 - API 형식 선택

OpenAI SDK 형식: POST /v1/chat/completions(모델 "gemini-3-flash-preview" 포함). 기본 API 형식: generateContent 또는 streamGenerateContent 메소드를 사용하는 POST /v1beta/models/gemini-3-flash-preview:{method}.

2

2단계 - 인증 및 입력 추가

승인 포함: 전달자 <token>. 텍스트 또는 다중 모드 부분(이미지, 비디오, 오디오, PDF)이 포함된 메시지/콘텐츠를 보냅니다.

3

3단계 - 스트리밍 또는 규모 조정

실시간 UX용 스트리밍을 활성화하거나 X-Async-Mode를 사용하여 작업 ID를 반환합니다. 비용 효율적인 대용량 실행을 위해 배치와 캐싱을 결합합니다.

기술 사양

gemini-3-flash-preview의 공식 모델 기능

문맥

1,048,576개의 입력 토큰

최대 1,048,576개의 입력 토큰과 65,536개의 출력 토큰.

다중 모드

다중 모드 입력

텍스트 출력을 포함한 텍스트, 이미지, 비디오, 오디오 및 PDF 입력.

추리

사고 + 구조화된 출력

신뢰할 수 있고 기계 판독이 가능한 결과를 위해 사고적이고 구조화된 출력이 지원됩니다.

도구

함수 호출 + 도구

함수 호출, 코드 실행, 파일 검색이 지원됩니다.

규모

캐싱 + 배치

반복적이거나 대규모 워크로드에 대해 컨텍스트 캐싱 및 배치 API이 지원됩니다.

접지

검색 접지 + URL 컨텍스트

검색 접지 및 URL 컨텍스트가 지원됩니다(Google 지도 접지는 지원되지 않음).

Gemini 3 플래시 미리보기 API FAQ

Everything you need to know about the product and billing.

Gemini 3 Flash는 속도, 규모 및 강력한 추론을 위해 구축된 균형 잡힌 모델입니다. 일상적인 작업, 에이전트 코딩, 다중 모드, 장기 컨텍스트 이해를 위해 설계되어 프로덕션 워크로드의 실질적인 기본값이 됩니다.
공식 프리뷰 모델명은 "gemini-3-flash-preview"입니다. 요청에 이 정확한 식별자를 사용하세요.
Gemini 3 Flash 미리 보기는 텍스트, 이미지, 비디오, 오디오 및 PDF 입력을 지원하고 텍스트 출력을 반환합니다. 이를 통해 단일 워크플로에서 혼합 매체 요약, 추출 및 질문 답변이 가능합니다.
최대 1,048,576개의 입력 토큰과 65,536개의 출력 토큰을 지원하여 긴 문서, 코드베이스 또는 다중 턴 세션을 위한 대규모 컨텍스트 창을 제공합니다.
함수 호출, 구조화된 출력, 코드 실행, 파일 검색, 사고, 컨텍스트 캐싱 및 배치 API을 지원합니다. 검색 기반 및 URL 컨텍스트는 다중 모달 함수 응답 및 이미지를 사용한 코드 실행과 함께 지원됩니다.
이미지 생성, 오디오 생성 및 Live API은 지원되지 않습니다. 이 모델에서는 Google 지도를 사용한 접지도 지원되지 않습니다.
최신 업데이트는 2025년 12월로 기재되어 있으며, 지식 마감일은 2025년 1월입니다.
EvoLink는 generateContent 또는 streamGenerateContent를 사용하여 OpenAI SDK 형식(POST /v1/chat/completions) 및 Google 기본 API 형식(POST /v1beta/models/gemini-3-flash-preview:{method})을 지원합니다. 권한 추가: 요청 헤더에 전달자 <token>.