Gemini 2.5 Flash Lite API

Nutzen Sie Gemini 2.5 Flash Lite auf EvoLink über OpenAI-kompatible oder native Gemini-Anfragen. Diese Route ist für günstige, hochvolumige Textarbeitslasten positioniert, bei denen Kostenkontrolle wichtiger ist als der Wechsel zu einem stärkeren Gemini-Modell.

Modelltyp:

Preis:

$0.094(~ 6.4 credits) pro 1 Mio. Input-Tokens; $0.374(~ 25.4 credits) pro 1 Mio. Output-Tokens

$0.0088(~ 0.6 credits) pro 1 Mio. Cache-Read-Tokens; $0.281(~ 19.1 credits) pro 1 Mio. Audio-Tokens

Google Search Grounding wird pro Anfrage separat berechnet.

Stabiler verwalteter Zugriff für Produktions-Workloads. Empfohlen, wenn Sie Dashboard-Abrechnung, API-Key-Kontrolle und planbares Integrationsverhalten benötigen.

Für alle Versionen wird derselbe API-Endpunkt verwendet. Nur der model-Parameter unterscheidet sich.

PRICING

PLAN	CONTEXT WINDOW	MAX OUTPUT	INPUT	OUTPUT	CACHE READ	AUDIO INPUT
Gemini 2.5 Flash Lite	1,048,576	65,536	$0.095-6% (6.4 Credits)	$0.374-7% (25.4 Credits)	$0.009-12% (0.60 Credits)	$0.281-6% (19.1 Credits)
Web Search Tool Server-side web search capability						$0.033/search (2.2 Credits)

Pricing Note: Prices show both USD and Credits. Units default to / 1M tokens unless noted separately.

Cache Hit: Price applies to cached prompt tokens.

Audio Input: Audio tokens charged at a separate rate.

Gemini 2.5 Flash Lite API

Name: EvoLink AI Model API Platform
Brand: EvoLink
Availability: InStock

Gemini 2.5 Flash Lite ist Googles kostengünstigste Gemini-Textroute auf EvoLink. Nutzen Sie sie für Übersetzung, Klassifikation, Extraktion, Tagging und Zusammenfassung in großem Umfang, wenn niedrige Token-Kosten wichtiger sind als ein Upgrade auf Gemini 2.5 Flash oder Pro.

Seiten-Keyword

Anfrage-Modell-ID

gemini-2.5-flash-lite

Optimale Einsatzbereiche

Übersetzungs- und Lokalisierungspipelines

Verwenden Sie Flash Lite für große Mengen an Produkttexten, Support-Inhalten, Hilfe-Center-Artikeln und mehrsprachigen Rückständen, bei denen niedrige Kosten pro Anfrage wichtiger sind als ein Upgrade auf ein stärkeres Reasoning-Modell.

Klassifikations-, Tagging- und Extraktionswarteschlangen

Ideal für Warteschlangen, die große Mengen an Tickets, Formularen, Katalogdaten, CRM-Notizen oder internen Textdaten labeln, sortieren, normalisieren oder strukturierte Felder extrahieren.

Zusammenfassung und Batch-Textverarbeitung

Nutzen Sie sie als kostengünstige Schicht für die Zusammenfassung langer Texte, Komprimierung repetitiver Inhalte oder Vorverarbeitung von Datensätzen, bevor nur die schwierigeren Fälle an Gemini 2.5 Flash oder Gemini 2.5 Pro weitergeleitet werden.

Wann diese Route wählen

Flash Lite macht am meisten Sinn als kostengünstige Schicht in einer Gemini-Routing-Strategie: ein Gateway, ein Authentifizierungsmuster und eine klarere Trennung zwischen günstiger Massenverarbeitung und stärkeren Gemini-Routen.

Wählen Sie Flash Lite, wenn Kosten und Durchsatz die Entscheidung bestimmen

Wenn die Arbeitslast hauptsächlich Übersetzung, Tagging, Extraktion, Zusammenfassung oder Batch-Textbereinigung umfasst, ist Flash Lite der praktische Startpunkt, da die Stückkosten niedrig bleiben, ohne einen separaten Integrationspfad zu erfordern.

Flash Lite nicht standardmäßig für schwierige Reasoning-Aufgaben verwenden

Flash Lite ist nicht die Route, auf die Sie Ihren Stack zentrieren sollten, wenn die Qualitätsschwelle höher ist, der Reasoning-Pfad komplexer wird oder zu viele Randfälle eine günstige Erstverarbeitungsschicht durchlaufen.

Upgrade auf Gemini 2.5 Flash oder Pro, wenn Qualität wichtiger als Preis ist

Wechseln Sie zu Gemini 2.5 Flash für eine stärkere Allzweckroute oder zu Gemini 2.5 Pro, wenn die Aufgabe ein leistungsfähigeres Premium-Modell rechtfertigt. EvoLink macht diese Routing-Aufteilung einfacher zu betreiben.

So starten Sie

Nutzen Sie diese Seite als schnelle Routenanleitung: Wählen Sie das Anfrageformat, verwenden Sie die korrekte Modell-ID und behalten Sie die detaillierte Anfragesyntax in der Dokumentation.

Schritt 1 – Anfrageformat wählen

Rufen Sie Gemini 2.5 Flash Lite über OpenAI-kompatible Anfragen oder native Gemini-Anfragen auf, abhängig von dem Stack, den Sie bereits verwenden.

Schritt 2 – Korrekte Modell-ID verwenden

Verwenden Sie die Anfrage-Modell-ID "gemini-2.5-flash-lite" für diese Route.

Schritt 3 – Die richtigen Arbeitslasten hierher leiten

Verwenden Sie Flash Lite für Übersetzung, Klassifikation, Extraktion, Tagging, Zusammenfassung und Batch-Textverarbeitung. Steigen Sie nur auf, wenn die Aufgabe eine stärkere Gemini-Route erfordert.

Kernfähigkeiten und Limits

Die wichtigsten Limits und Produktionssignale, die bei der Entscheidung zählen, ob diese Route zu Ihrer Arbeitslast passt

Kontext

1.048.576 Eingabe-Token

Unterstützt bis zu 1.048.576 Eingabe-Token für lange Prompts, große Dokumente und Batch-Textverarbeitung.

Ausgabe

65.536 maximale Ausgabe-Token

Am besten geeignet für kompakte Ausgaben wie Labels, Zusammenfassungen, extrahierte Felder und Textantworten.

Eingabe

Text + Audio Eingabe, Text Ausgabe

Akzeptiert Text- und Audio-Eingabe, mit Textausgabe für Transkriptions-nahe und Textverarbeitungs-Workflows.

Caching

Implizites Caching

Wiederholter Kontext kann von implizitem Caching profitieren, was die Kosten bei überlappenden Anfragen reduziert.

Skalierung

Batch API

Unterstützt Batch API für Warteschlangen-, Offline- oder andere Hochvolumen-Verarbeitungsmuster.

Preise

Kostengünstigste Gemini-Textroute

Positioniert unterhalb von Gemini 2.5 Flash in Fähigkeit und Preis, was sie zur praktischen Budget-Schicht für Massentext-Arbeitslasten macht.

Gemini 2.5 Flash Lite API FAQs

Everything you need to know about the product and billing.

Ja. Flash Lite ist sowohl im Preis als auch in der Leistung unterhalb von Gemini 2.5 Flash positioniert und für kostengünstige Massentext-Arbeitslasten gedacht.

Ja. EvoLink unterstützt sowohl OpenAI-kompatible Anfragen als auch native Gemini-Anfragen für diese Route.

Verwenden Sie "gemini-2.5-flash-lite" als Anfrage-Modell-ID.

Gemini 2.5 Flash Lite unterstützt bis zu 1.048.576 Eingabe-Token und bis zu 65.536 Ausgabe-Token.

Ja. Diese Route unterstützt Text- und Audio-Eingabe mit Textausgabe.

Implizites Caching kann wiederholte Token-Kosten reduzieren, wenn Anfragen überlappenden Kontext teilen, was besonders nützlich für wiederkehrende Prompts und Batch-Arbeitslasten ist.

Wählen Sie Flash Lite, wenn Übersetzung, Tagging, Extraktion, Zusammenfassung und andere hochvolumige Textaufgaben die niedrigsten praktischen Kosten erfordern. Steigen Sie auf Flash um, wenn Sie eine stärkere Allzweckroute benötigen.

Es ist am besten geeignet für Übersetzung, Klassifikation, Extraktion, Tagging, Zusammenfassung und andere Batch-Textverarbeitungsarbeitslasten, bei denen Kosten und Durchsatz wichtiger sind als standardmäßig ein stärkeres Modell zu verwenden.

Ja. Gemini 2.5 Flash Lite unterstützt Function Calling, ist aber in der Regel am besten als kostengünstige Textroute positioniert und nicht als stärkste Option für die schwierigsten tool-intensiven Reasoning-Aufgaben.

Gemini API-Modelle auf EvoLink

Gemini 2.5 Flash Lite ist Googles günstigste Gemini-Textroute. Für stärkere Multimodalität wechseln Sie zu Gemini 2.5 Flash, für Frontier-Reasoning zu Gemini 3.1 Pro.

Gemini-Familie entdecken Gemini 2.5 Flash Gemini 2.5 Pro Gemini 3.1 Pro