Gemini Omni 곧 출시자세히 보기

Gemini 3.1 Pro Preview API

EvoLink? Gemini 3.1 Pro Preview ???? ??? ??, ???? ??, ?? ?????? ?? ???? 1M context, thinking mode, CustomTools ??? ?????.
모델 유형:
가격: 

$1.865 - 3.729(~ 126.8 - 253.6 credits) per 1M input tokens; $11.182 - 16.774(~ 760.4 - 1140.6 credits) per 1M output tokens

$0.187 - 0.374(~ 12.7 - 25.4 credits) per 1M cache read tokens

Google Search grounding charged separately per query.

99.9% 가용성이 보장되는 가장 안정적인 버전으로, 프로덕션 환경에 권장됩니다.

모든 버전은 동일한 API 엔드포인트를 사용하며 model 파라미터만 다릅니다.

Gemini 3.1 Pro ? Gemini ?? API ???

Gemini 3.1 Pro? EvoLink? ?? ? ??? Gemini ??????. 1M tokens? ?? $2 / ?? $12, OpenAI SDK ??, thinking mode, tool use? ?????.

example 1

Gemini 3.1 Pro가 Google 최상위 모델인 이유

최첨단 코딩 & 추론

Gemini 3.1 Pro는 코딩 작업에서 Google의 최상위 모델입니다. SWE-bench, HumanEval 등 공개 벤치마크에서 Claude Opus 4.6, GPT 5.4와 경쟁하는 성능을 보여줍니다.

example 2

에이전트 워크플로우 & CustomTools

Thinking 모드, function calling, 구조화 출력, 도구 집약적 파이프라인을 위한 전용 CustomTools 변형 (gemini-3.1-pro-customtools)을 갖춘 멀티스텝 에이전트 루프를 위해 설계되었습니다.

example 3

1M 컨텍스트 + 프로덕션 제어

전체 코드베이스, 장문 문서, 멀티턴 대화를 단일 요청으로 처리할 수 있습니다. 캐싱, Batch API, Google 검색 그라운딩으로 프로덕션 규모 배포에 대응합니다.

example 4

EvoLink에서 Gemini 3.1 Pro를 선택하는 이유

Gemini 3.1 Pro는 동급 모델 대비 낮은 가격에 강력한 추론 성능을 제공하며, EvoLink는 OpenAI SDK 호환, 사용량 추적, 통합 결제 기능을 추가합니다.

최고의 가격 대비 성능

1M 토큰당 $2/$12로 Claude Opus 4.6 ($15/$75)를 크게 하회하는 가격입니다. 특정 작업의 성능 데이터는 벤치마크 비교를 확인하세요.

OpenAI 드롭인 대체

동일한 /v1/chat/completions 형식과 OpenAI SDK를 사용합니다. GPT 모델에서 전환 시 모델 문자열과 API 기본 URL만 변경하면 됩니다.

완전한 사용량 투명성

모든 응답에 prompt_tokens, completion_tokens, reasoning_tokens, 캐시 사용량이 포함됩니다. 요청별 비용과 추론 깊이를 토큰 단위로 추적할 수 있습니다.

Gemini 3.1 Pro Preview 호출 방법

OpenAI SDK 형식과 gemini-3.1-pro-preview 모델 문자열을 사용하세요.

1

1단계 - 모델 설정

요청 본문에서 model: "gemini-3.1-pro-preview"를 사용하세요.

2

2단계 - 메시지 전송

role/content 쌍 (최소 길이 1)을 포함한 messages 배열을 제공합니다.

3

3단계 - 출력 + 사용량 확인

choices[0].message.content를 읽고 usage.prompt_tokens, completion_tokens, reasoning_tokens를 추적하세요.

Gemini 3.1 Pro Preview 스펙

Google 플래그십 추론 모델의 기술 세부사항

모델

모델 ID

gemini-3.1-pro-preview (범용) 또는 gemini-3.1-pro-customtools (도구 집약적 워크로드).

요금

입력 요금

1M 토큰당 $2.00 (표준), 200K 토큰 초과 프롬프트는 $4.00.

요금

출력 요금

1M 토큰당 $12.00 (표준), 200K 토큰 초과 대량 프롬프트는 $18.00.

한도

컨텍스트 윈도우

1,000,000 입력 토큰 (1M 컨텍스트). 최대 출력: 65,536 토큰.

멀티모달

지원 입력

텍스트, 코드, 이미지, 비디오, 오디오, PDF. 출력은 텍스트만. Google 검색 그라운딩 + URL 컨텍스트 지원.

라이프사이클

3.0 Pro에서 업그레이드

초기 Gemini 3 Pro Preview 대비 코딩 벤치마크, 지시 따르기, 에이전트 도구 사용이 향상되었습니다.

Gemini 3.1 Pro API FAQ

Everything you need to know about the product and billing.

Gemini 3.1 Pro는 코딩과 추론 벤치마크에서 경쟁력 있는 성능을 보입니다. 최대 강점은 가격으로, 1M 토큰당 $2/$12이며 Claude Opus 4.6 ($15/$75)과 GPT 5.4를 크게 하회합니다. 작업별 성능 데이터는 상세 벤치마크 비교를 참고하세요.
Google은 코딩 벤치마크 점수, 지시 따르기 정확도, 에이전트 도구 사용 안정성, 응답 일관성을 개선했습니다. 도구 집약적 워크플로우를 위한 전용 CustomTools 변형도 추가되었습니다. 1M 컨텍스트 윈도우와 요금은 동일합니다.
gemini-3.1-pro-customtools는 function calling, tools 배열, 멀티스텝 에이전트 루프에 의존하는 요청에 최적화된 EvoLink의 별도 라우트입니다. 기본 라우트와 동일 요금입니다. 범용 추론에는 기본 gemini-3.1-pro-preview를 사용하세요.
Standard: $2.00 input / $12.00 output per 1M tokens. Check the EvoLink dashboard and official Gemini pricing docs for current grounding and tool charges.
model 값으로 "gemini-3.1-pro-preview"를 사용합니다. 도구 집약적 워크로드의 경우 "gemini-3.1-pro-customtools"를 사용하세요. 둘 다 api.evolink.ai/v1/chat/completions에 Bearer token 인증으로 요청합니다.
네. Thinking 모드로 복잡한 작업에 대한 chain-of-thought 추론이 가능합니다. 추론 토큰은 completion_tokens_details.reasoning_tokens에서 별도로 추적되어 추론 깊이와 비용을 모니터링할 수 있습니다.
1,000,000 입력 토큰 (1M 컨텍스트), 최대 출력 토큰 65,536. 캐싱 (암시적 + 명시적)과 Batch API를 통한 장문 컨텍스트 파이프라인을 지원합니다.
네. EvoLink의 엔드포인트는 완전한 OpenAI SDK 호환입니다. 표준 model + messages 형식으로 /v1/chat/completions를 사용합니다. 모델 문자열과 기본 URL만 변경하면 다른 OpenAI 모델에서 전환할 수 있으며, 다른 코드 변경은 필요 없습니다.
Wait 5-10 minutes and retry. For production reliability, use the recommended preview route for your workload and keep a fallback model configured.

Gemini 패밀리에서 Gemini 3.1 Pro의 위치

Gemini 3.1 Pro는 Google의 현재 플래그십 추론 모델입니다. 도구 중심 에이전트 워크플로에는 CustomTools, 저비용 작업에는 Flash, 경쟁 모델 비교에는 GPT 5.4 및 Claude Opus 4.6을 참고하세요. Gemini 패밀리를 탐색하거나 비교 가이드를 읽고 적합한 모델을 선택하세요.