GLM-5.2 提供開始詳しく見る

GLM-5.2 API

EvoLink を通じて Z.ai GLM-5.2 を、OpenAI 互換(/v1/chat/completions)エンドポイントで 1 つの API キーで使用。約 1M コンテキストウィンドウ、ディープシンキング、ツール呼び出し、プロンプトキャッシュを備え、Coding agents、エージェント型ワークフロー、リポジトリ Q&A、ツールを使うアシスタントに最適。入力価格は $1.00/1M トークンから。
モデルタイプ:

価格: $1.000(~ 68 credits) per 1M input tokens

99.9% の稼働率を保証する最も安定した構成で、本番環境に推奨されます。

すべてのバージョンで同じ API エンドポイントを使用し、異なるのは model パラメータのみです。

GLM-5.2 API

EvoLink 経由で Z.ai GLM-5.2 を Coding agents、エージェント型ツール利用、リポジトリ Q&A、長文コンテキスト分析に活用。約 1M コンテキストウィンドウ、ディープシンキング、プロンプトキャッシュを提供。OpenAI 互換エンドポイントで接続でき、価格は入力 $1.00/1M トークンから。

接続とワークフロー適性

適した用途

Coding Agents

Model ID

glm-5.2

接続方式

OpenAI-compatible

コンテキスト

1M ウィンドウ

Input

$1.00/1M

内蔵

思考 + ツール + キャッシュ

GLM-5.2 API のヒーロー紹介

GLM-5.2 API で何を構築できますか?

Coding Agents & 開発者ツール

リポジトリ Q&A、コード生成、レビューを処理する Coding copilots とエージェントを構築。GLM-5.2 は OpenAI Chat Completions API に対応しているため、OpenAI 互換エンドポイントをすでにサポートするエディター拡張機能、コーディング CLI、エージェントフレームワークにそのまま組み込めます。ディープシンキングは 1 つの API でマルチステップ推論を処理します。

GLM-5.2 API コーディングのユースケース紹介

エージェント型ツール利用 & 関数呼び出し

ツールを呼び出し、API にクエリを発行し、マルチステップワークフローをオーケストレーションする自律エージェントを駆動。GLM-5.2 の関数呼び出しとディープシンキングにより、計画、ツール呼び出し、結果への対応が可能になり、1 つのエンドポイントで研究エージェント、データパイプライン、タスク自動化を構築できます。

GLM-5.2 API エージェントのユースケース紹介

長文コンテキストのドキュメント & リポジトリ処理

契約書、レポート、コードベース、大規模なナレッジベースを積極的なチャンキングなしで処理。約 1M コンテキストウィンドウは構造化要約、抽出パイプライン、リポジトリ全体の分析に適しており、プロンプトキャッシュにより繰り返しの長いプレフィックスを低コストに保ちます。

GLM-5.2 API ドキュメントのユースケース紹介

チームが GLM-5.2 API を選ぶ理由

チームは、強力なコーディングとエージェント型推論、長文コンテキスト、OpenAI 互換アクセス、予測可能なトークン価格を、ベンダー固有の統合を構築せずに必要とする場合に、EvoLink で GLM-5.2 を選択します。

OpenAI 互換アクセス

1 つの EvoLink キーで、OpenAI 互換の /v1/chat/completions エンドポイント経由で GLM-5.2 を呼び出せます。既存の OpenAI SDK コードとツールは、統合パスを再構築することなく動作します。ベース URL とモデル名を変更するだけです。

予測可能な本番コスト

可視化されたトークン価格により予算編成が容易:入力 $1.00/1M から、出力 $3.50/1M、繰り返しプロンプトのキャッシュ読み取りは約 $0.25/1M。価格は約 1M コンテキスト全体にわたって一律レートで、長文コンテキストの追加料金はありません。キャッシュ入力のストレージは期間限定キャンペーン中は無料です。

thinking、ツール、キャッシュ

大きなプロンプトには約 1M コンテキストを使用し、複雑な推論にはディープシンキングを有効化し、構造化された関数呼び出しでツールを呼び出し、繰り返しコンテキストのコストを削減するためにプロンプトキャッシュを活用できます。

モデル比較

GLM-5.2 vs GPT-5.5 vs Claude Opus 4.8

Coding agents の候補としてこの3モデルを比較します。同じ repo Q&A、複数ファイルのリファクタ、PR review、tool calling のトレースで検証してください。

モデル適した用途GLM-5.2 と比較する項目ルーティング上の役割
GLM-5.2OpenAI 互換の coding agents、1M context のリポジトリ作業、コストを意識した開発タスク。リポジトリ全体のQ&A、長文コンテキスト保持、ツールループ、prompt caching、成功タスクあたりのコスト。Coding-agent ワークロードのデフォルト候補またはコスト重視ルート。
GPT-5.5OpenAI の複雑推論と coding の flagship。SDK とツールエコシステムとの相性が強い。難しいデバッグ、アーキテクチャレビュー、既存 GPT ワークフロー、premium escalation。GPT 側の premium benchmark または escalation route。
Claude Opus 4.8複雑推論、long-horizon agentic coding、高自治のエンジニアリング作業。複数ファイルのリファクタ、PR review 品質、tool-use recovery、長時間 agent session。最も難しい coding-agent トレース向けの Claude premium benchmark。

製品ページで絶対的な勝者を断定すべきではありません。重要なのは自社のトレースで勝つルートです。

比較ガイドを読む

GLM-5.2 API の統合方法

既存の OpenAI 互換クライアントを維持し、EvoLink を指定し、モデルを glm-5.2 に設定し、Coding-agent、エージェント型、長文コンテキストワークフローに同じルートを使用。

GLM-5.2 API の統合方法
1

ステップ 1 — 認証

EvoLink API キーを作成し、EvoLink ベース URL を設定。OpenAI 互換エンドポイントには Bearer 認証を使用。

2

ステップ 2 — 必須フィールドの設定

`model: glm-5.2` を `messages` 配列と共に送信。繰り返しワークロードでプロンプトキャッシュの恩恵を受けるため、安定したシステムプロンプトとプレフィックスを再利用。

3

ステップ 3 — 出力の調整

通常通り temperature、top_p、max_tokens、stream を調整。関数呼び出しには `tools` を渡します。注意:thinking はデフォルトで有効になっており、出力トークンが増加します。深い推論が不要な場合はコスト削減のため `thinking` を無効に設定してください。

本番チーム向け GLM-5.2 API 機能

一般的なモデル概要ではなく、具体的な制御とデプロイメントシグナル

Thinking

ディープシンキングモード

数学、論理、複雑なマルチステップ分析には thinking を有効化。推論は別フィールドまたはコンテンツブロックとして公開されるため、製品内で思考の連鎖を表示または非表示にできます。デフォルトで有効になっており、リクエストごとに無効化できます。

Context

約 1M コンテキストウィンドウ

積極的なチャンキングやマルチパスオーケストレーションに頼る前に、コードベース全体、長文ドキュメント、マルチターンコンテキストを 1 つのリクエストに収める。

Tools

ツール呼び出し & 関数呼び出し

ツールを定義し、GLM-5.2 に構造化された引数で計画・呼び出しをさせることで、自律エージェント、API オーケストレーション、タスク自動化を実現。

Compatibility

OpenAI 互換 API

ベース URL とモデル名を変更するだけで、/v1/chat/completions 経由の OpenAI SDK で接続でき、統合の再構築は不要。

Caching

プロンプトキャッシュ

繰り返しプレフィックスとシステムプロンプトはより低いキャッシュ読み取りレートで課金され、定期的なエージェントワークフローと大量の本番トラフィックに役立ちます。キャッシュ入力のストレージは期間限定キャンペーン中は無料です。

Pricing

一律トークン価格

GLM-5.2 は約 1M コンテキストウィンドウ全体にわたって単一の一律レートを使用し、長文コンテキストの追加料金はないため、コストはプロンプトサイズに応じて予測可能にスケールします。

GLM-5.2 API よくある質問

Everything you need to know about the product and billing.

EvoLink での GLM-5.2 の価格は、入力トークン 1M あたり約 $1.00、出力トークン 1M あたり約 $3.50 から始まります。キャッシュ読み取りは 1M トークンあたり約 $0.25 から始まり、キャッシュ入力のストレージは期間限定キャンペーン中は無料です。価格は約 1M コンテキストウィンドウ全体にわたって一律レートで、長文コンテキストの追加料金はありません。
GLM-5.2 は、Coding agents、OpenAI 互換のコーディング CLI やエディターツール、エージェント型ツール利用、リポジトリ Q&A、研究ワークフロー、約 1M コンテキスト・ディープシンキング・関数呼び出し・プロンプトキャッシュの恩恵を受ける長文ドキュメント分析に強く適しています。
GLM-5.2 はおよそ 1M トークンのコンテキストウィンドウをサポートします。ウィンドウ全体にわたって単一の一律レートで課金され、長文コンテキストの追加料金はありません。
はい。GLM-5.2 は複雑な推論向けのディープシンキングモード(デフォルトで有効、無効化可能)、エージェント型ツール利用向けの構造化された関数呼び出し、繰り返しプレフィックスをより低いキャッシュ読み取りレートで課金するプロンプトキャッシュをサポートしています。テキストモデルであり、画像、動画、音声入力は受け付けません。
実際に本番投入する予定のワークロードで比較してください:リポジトリ Q&A、複数ファイルのレビュー、coding-agent ループ、ツール呼び出し、レイテンシ、トークンの総コストです。GLM-5.2 は長文コンテキストとエンジニアリングエージェントへの適合が重要な場合に有力な候補であり、より単純なタスクは同じ EvoLink ゲートウェイ経由で低コストのモデルにルーティングするほうが良い場合があります。
はい。EvoLink は GLM-5.2 を OpenAI 互換エンドポイント(/v1/chat/completions)で公開しています。ベース URL を変更し、モデルを glm-5.2 に設定することで、OpenAI SDK または任意の OpenAI 互換クライアントを使用できます。
通常は可能です。GLM-5.2 は OpenAI Chat Completions API に対応しているため、OpenAI 互換エンドポイントをサポートするコーディング CLI、エディターツール、エージェントフレームワークに適合します。隣接するセットアップパターンについては、3 つの Coding CLI 向けの 1 つのゲートウェイゲートウェイ vs 直接 API を参照してください。
リクエストボディでモデル enum `glm-5.2` を使用してください。EvoLink が最適なプロバイダーを通じて GLM-5.2 にリクエストをルーティングします。