HappyHorse 1.0 곧 출시자세히 보기

Gemini 3 플래시 미리보기 API

OpenAI SDK 호환성 및 기본 Gemini API 지원을 통해 EvoLink을 통해 Google의 Gemini 3 Flash 미리보기(gemini-3-flash-preview)에 액세스하세요. 1,048,576개의 토큰 컨텍스트 창과 프로덕션 워크로드를 위한 캐싱 및 배치 옵션을 사용하여 텍스트, 이미지, 비디오, 오디오 및 PDF 입력을 보냅니다.
가격: 

$0.400(~ 28.8 credits) per 1M input tokens; $2.400(~ 172.8 credits) per 1M output tokens

$0.040(~ 2.9 credits) per 1M cache read tokens; $0.800(~ 57.6 credits) per 1M audio tokens

Google Search grounding charged separately per query.

99.9% 가용성이 보장되는 가장 안정적인 버전으로, 프로덕션 환경에 권장됩니다.

모든 버전은 동일한 API 엔드포인트를 사용하며 model 파라미터만 다릅니다.

Gemini 3 플래시 미리보기 EvoLink의 API

속도와 규모를 고려하여 제작된 Gemini 3 Flash Preview는 텍스트, 이미지, 비디오, 오디오 및 PDF를 이해하고 대규모 컨텍스트(최대 100만 개 토큰)를 처리합니다. 실시간 도우미, 문서 이해, 미디어 분석에 대한 명확하고 신뢰할 수 있는 답변을 제공합니다.

Gemini 3 플래시 미리보기 API

Gemini 3 Flash 미리보기로 구축할 수 있는 것

다중 모드 입력, 안정적인 텍스트 출력

단일 요청에는 텍스트, 이미지, 비디오, 오디오 또는 PDF가 포함될 수 있으며 텍스트 출력이 반환될 수 있습니다. 이를 통해 별도의 파이프라인 없이 쉽게 회의를 요약하고, 미디어를 검토하고, 구조화된 통찰력을 추출할 수 있습니다.

다중 모드 입력

긴 세션을 위한 1M-토큰 컨텍스트

단일 요청으로 최대 1,048,576개의 입력 토큰과 65,536개의 출력 토큰을 처리합니다. 이를 통해 긴 문서, 코드베이스 또는 여러 차례의 채팅을 하나의 일관된 컨텍스트로 유지할 수 있습니다.

긴 컨텍스트

도구, 접지 및 추론

함수 호출, 코드 실행, 파일 검색, 검색 기반 및 URL 컨텍스트를 통해 사고 및 구조화된 출력을 사용합니다. 규모와 비용 제어를 위해 일괄 API 및 캐싱이 지원됩니다.

압형

Gemini 3 플래시 미리보기에 EvoLink을 사용하는 이유

공식 Gemini 기능과 가격을 사용하여 OpenAI SDK 형식 또는 Google 기본 API 형식을 통해 gemini-3-flash-preview를 실행하세요.

하나의 통합, 두 가지 형식

앱 로직을 변경하지 않고 OpenAI SDK 또는 기본 Gemini 형식으로 Gemini 3 Flash 미리보기를 호출하세요.

배치 + 캐싱 비용 절감

일괄 처리 및 컨텍스트 캐싱을 사용하여 반복 비용을 낮추는 동시에 대용량 워크로드를 안전하게 확장합니다.

프로덕션 사용 준비 완료

다중 모드 입력, 긴 컨텍스트 및 도구 지원은 실제 생산 보조, 분석 및 자동화 워크플로우를 포괄합니다.

Gemini 3 플래시 미리보기를 호출하는 방법

OpenAI SDK 또는 Google 기본 API 형식을 선택한 다음 요청을 보내세요.

1

1단계 - API 형식 선택

OpenAI SDK 형식: POST /v1/chat/completions(모델 "gemini-3-flash-preview" 포함). 기본 API 형식: generateContent 또는 streamGenerateContent 메소드를 사용하는 POST /v1beta/models/gemini-3-flash-preview:{method}.

2

2단계 - 인증 및 입력 추가

승인 포함: 전달자 <token>. 텍스트 또는 다중 모드 부분(이미지, 비디오, 오디오, PDF)이 포함된 메시지/콘텐츠를 보냅니다.

3

3단계 - 스트리밍 또는 규모 조정

실시간 UX용 스트리밍을 활성화하거나 X-Async-Mode를 사용하여 작업 ID를 반환합니다. 비용 효율적인 대용량 실행을 위해 배치와 캐싱을 결합합니다.

기술 사양

gemini-3-flash-preview의 공식 모델 기능

문맥

1,048,576개의 입력 토큰

최대 1,048,576개의 입력 토큰과 65,536개의 출력 토큰.

다중 모드

다중 모드 입력

텍스트 출력을 포함한 텍스트, 이미지, 비디오, 오디오 및 PDF 입력.

추리

사고 + 구조화된 출력

신뢰할 수 있고 기계 판독이 가능한 결과를 위해 사고적이고 구조화된 출력이 지원됩니다.

도구

함수 호출 + 도구

함수 호출, 코드 실행, 파일 검색이 지원됩니다.

규모

캐싱 + 배치

반복적이거나 대규모 워크로드에 대해 컨텍스트 캐싱 및 배치 API이 지원됩니다.

접지

검색 접지 + URL 컨텍스트

검색 접지 및 URL 컨텍스트가 지원됩니다(Google 지도 접지는 지원되지 않음).

Gemini 3 플래시 미리보기 API FAQ

Everything you need to know about the product and billing.

Gemini 3 Flash는 속도, 규모 및 강력한 추론을 위해 구축된 균형 잡힌 모델입니다. 일상적인 작업, 에이전트 코딩, 다중 모드, 장기 컨텍스트 이해를 위해 설계되어 프로덕션 워크로드의 실질적인 기본값이 됩니다.
공식 프리뷰 모델명은 "gemini-3-flash-preview"입니다. 요청에 이 정확한 식별자를 사용하세요.
Gemini 3 Flash 미리 보기는 텍스트, 이미지, 비디오, 오디오 및 PDF 입력을 지원하고 텍스트 출력을 반환합니다. 이를 통해 단일 워크플로에서 혼합 매체 요약, 추출 및 질문 답변이 가능합니다.
최대 1,048,576개의 입력 토큰과 65,536개의 출력 토큰을 지원하여 긴 문서, 코드베이스 또는 다중 턴 세션을 위한 대규모 컨텍스트 창을 제공합니다.
함수 호출, 구조화된 출력, 코드 실행, 파일 검색, 사고, 컨텍스트 캐싱 및 배치 API을 지원합니다. 검색 기반 및 URL 컨텍스트는 다중 모달 함수 응답 및 이미지를 사용한 코드 실행과 함께 지원됩니다.
이미지 생성, 오디오 생성 및 Live API은 지원되지 않습니다. 이 모델에서는 Google 지도를 사용한 접지도 지원되지 않습니다.
최신 업데이트는 2025년 12월로 기재되어 있으며, 지식 마감일은 2025년 1월입니다.
EvoLink는 generateContent 또는 streamGenerateContent를 사용하여 OpenAI SDK 형식(POST /v1/chat/completions) 및 Google 기본 API 형식(POST /v1beta/models/gemini-3-flash-preview:{method})을 지원합니다. 권한 추가: 요청 헤더에 전달자 <token>.
Beta 버전은 실험용 버전으로, 가격은 더 낮지만 100% 가용성을 보장하지 않습니다. 이 오류가 발생하면: 1. 잠시 기다렸다가 재시도: 보통 5-10분 내에 복구됩니다. 2. 공식 버전으로 전환: model ID를 gemini-3-flash-preview-beta에서 gemini-3-flash-preview로 변경하세요.공식 버전은 99.9% uptime을 보장하며