Seedance 2.0 API — Coming SoonGet early access

Gemini 3.1 Pro 프리뷰 API

EvoLink의 OpenAI 호환 /v1/chat/completions 엔드포인트를 통해 gemini-3.1-pro-preview에 액세스하세요. 상세한 토큰 계정으로 코딩, 멀티모달 추론 및 도구 사용을 위해 구축되었습니다.

Run With API
Using coding CLIs? Run Gemini 3.1 Pro via EvoCode — One API for Code Agents & CLIs. (View Docs)
$

PRICING

PLANCONTEXT WINDOWMAX OUTPUTINPUTOUTPUTCACHE READ
Gemini 3.1 Pro1.05M65.5K
200.0K$1.600-20%
$2.00Official Price
>200.0K$3.200-20%
$4.00Official Price
200.0K$9.60-20%
$12.00Official Price
>200.0K$14.40-20%
$18.00Official Price
200.0K$0.160-20%
$0.200Official Price
>200.0K$0.319-20%
$0.400Official Price
Gemini 3.1 Pro (Beta)1.05M65.5K
200.0K$0.520-74%
$2.00Official Price
>200.0K$1.04-74%
$4.00Official Price
200.0K$3.12-74%
$12.00Official Price
>200.0K$4.68-74%
$18.00Official Price
200.0K$0.052-74%
$0.200Official Price
>200.0K$0.104-74%
$0.400Official Price

Pricing Note: Price unit: USD / 1M tokens

Cache Hit: Price applies to cached prompt tokens.

Two ways to run Gemini 3.1 Pro — pick the tier that matches your workload.

  • · Gemini 3.1 Pro: the default tier for production reliability and predictable availability.
  • · Gemini 3.1 Pro (Beta): a lower-cost tier with best-effort availability; retries recommended for retry-tolerant workloads.

Gemini 3.1 Pro 프리뷰 API — OpenAI SDK 호환

EvoLink을 통해 OpenAI SDK 형식으로 gemini-3.1-pro-preview를 호출하세요. 응답에서 사용량과 reasoning_tokens를 얻고 테스트에서 보고된 1M 컨텍스트 창을 활용하세요.

예시 1

Gemini 3.1 Pro Preview API의 기능

멀티모달 입력 + 그라운딩

Gemini 3.1 Pro Preview API는 텍스트 전용 출력으로 텍스트, 코드, 이미지, 비디오, 오디오 및 PDF 입력을 허용하고 검증 가능한 답변을 위한 검색 그라운딩과 URL 컨텍스트를 지원합니다.

예시 2

사고 + 에이전트 도구

에이전트 추론 및 자동화를 위해 사고, 함수 호출, 구조화된 출력, 코드 실행 및 파일 검색이 지원됩니다.

예시 3

1M 컨텍스트 + 운영 제어

입력 토큰 제한은 1,048,576이며 출력 토큰은 최대 65,536입니다. 캐싱 및 배치 API가 장문 컨텍스트 파이프라인을 지원합니다.

예시 4

EvoLink에서 Gemini 3.1 Pro를 사용하는 이유

EvoLink은 친숙한 OpenAI SDK 스타일 엔드포인트를 통해 Gemini 3.1 Pro Preview를 제공하며 프로덕션 등급 추적을 위한 명시적 인증과 상세한 사용 통계를 제공합니다.

OpenAI SDK 형식

model + messages를 사용하여 /v1/chat/completions를 호출합니다. messages 배열은 필수입니다 (최소 길이 1).

세분화된 사용량 메트릭

사용량에는 prompt_tokens, completion_tokens, total_tokens 및 completion_tokens_details.reasoning_tokens가 포함됩니다.

모델 품질 신호

더 강력한 지시 따르기, 개선된 응답 일관성, 코딩 및 추론 벤치마크에서 우수한 결과.

Gemini 3.1 Pro Preview 호출 방법

OpenAI SDK 형식과 gemini-3.1-pro-preview 모델 문자열을 사용하세요.

1

1단계 - 모델 설정

요청 본문에서 model: "gemini-3.1-pro-preview"를 사용하세요.

2

2단계 - 메시지 보내기

role/content 쌍 (최소 길이 1)을 포함한 messages 배열을 제공합니다.

3

3단계 - 출력 + 사용량 확인

choices[0].message.content를 읽고 usage.prompt_tokens, completion_tokens, reasoning_tokens를 추적하세요.

기술 사양

Gemini 3.1 Pro Preview API의 주요 세부 정보

호환성

OpenAI SDK 형식

표준 /v1/chat/completions 인터페이스를 사용합니다.

모델

모델 문자열

이 엔드포인트에 대해 모델을 gemini-3.1-pro-preview로 설정합니다.

분석

사용량 분석

응답에는 프롬프트/완성 합계와 상세한 토큰 카테고리가 포함됩니다.

추론

추론 토큰

completion_tokens_details에는 심층 분석을 위한 reasoning_tokens가 포함됩니다.

멀티모달

멀티모달 추론 초점

더 강력한 멀티모달 추론 및 도구 사용 능력.

컨텍스트

1M 컨텍스트 창

긴 에이전트 흐름을 지원하는 1M 컨텍스트 창.

Gemini 3.1 Pro API FAQ

Everything you need to know about the product and billing.

Gemini 3.1 Pro는 Google Gemini 3 멀티모달 모델 패밀리의 최신 버전입니다. 이 페이지는 Gemini 3.1 Pro Preview (모델 코드: gemini-3.1-pro-preview)에 초점을 맞추고 있으며, 텍스트, 이미지, 비디오, 오디오, PDF 입력과 텍스트 출력을 지원하고, 사고, 함수 호출, 구조화된 출력, 코드 실행, 파일 검색, 검색 그라운딩, URL 컨텍스트, 캐싱 및 배치 API를 지원합니다.
EvoLink의 Gemini 3.1 Pro Preview API에 대해 모델 값으로 "gemini-3.1-pro-preview"를 사용하세요. OpenAI 호환 채팅 완성 엔드포인트에 권장되는 모델 문자열입니다.
api.evolink.ai/v1/chat/completions에 POST 요청을 보냅니다. EvoLink 대시보드의 API 키를 사용하여 Authorization: Bearer <token>과 Content-Type: application/json을 포함합니다.
model과 필수 messages 배열 (최소 길이 1)을 포함한 OpenAI SDK 채팅 완성 형식. 각 메시지는 role/content 쌍을 사용하고, 멀티모달 입력은 content parts로 전달할 수 있으며, 일반적인 옵션에는 stream, max_tokens, temperature가 포함됩니다.
입력에는 텍스트, 이미지, 비디오, 오디오, PDF가 포함되며 출력은 텍스트만 가능합니다. 이 Gemini 3.1 Pro Preview 모델에서는 이미지 또는 오디오 생성이 지원되지 않습니다.
입력 토큰 제한은 1,048,576 (1M 컨텍스트)이고 최대 출력 토큰은 65,536입니다. 긴 문서와 멀티턴 컨텍스트를 지원합니다.
사고, 함수 호출, 구조화된 출력, 코드 실행, 파일 검색, 검색 그라운딩, URL 컨텍스트, 캐싱 및 배치 API가 지원됩니다. URL 컨텍스트의 경우 도구 사용과 함께하는 함수 호출은 현재 지원되지 않으며, URL당 최대 34MB로 최대 20개 URL을 전달할 수 있습니다.
EvoLink 응답에는 usage.prompt_tokens, completion_tokens, total_tokens와 prompt_tokens_details 및 completion_tokens_details.reasoning_tokens가 포함됩니다. 이러한 필드를 사용하여 비용, 지연 시간 및 추론 토큰 소비를 모니터링합니다.