Gemini 2.5 Flash Lite API
$0.081(~ 5.8 credits) per 1M input tokens; $0.321(~ 23.1 credits) per 1M output tokens
$0.0083(~ 0.6 credits) per 1M cache read tokens; $0.240(~ 17.3 credits) per 1M audio tokens
Google Search grounding charged separately per query.
Höchste Stabilität mit garantierter 99,9% Verfügbarkeit. Empfohlen für Produktionsumgebungen.
Für alle Versionen wird derselbe API-Endpunkt verwendet. Nur der model-Parameter unterscheidet sich.
Gemini 2.5 Flash Lite API
Gemini 2.5 Flash Lite ist Googles kostengünstigste Gemini-Textroute auf EvoLink. Nutzen Sie sie für Übersetzung, Klassifikation, Extraktion, Tagging und Zusammenfassung in großem Umfang, wenn niedrige Token-Kosten wichtiger sind als ein Upgrade auf Gemini 2.5 Flash oder Pro.
Seiten-Keyword
Gemini 2.5 Flash Lite API
Anfrage-Modell-ID
gemini-2.5-flash-lite

Optimale Einsatzbereiche
Übersetzungs- und Lokalisierungspipelines
Verwenden Sie Flash Lite für große Mengen an Produkttexten, Support-Inhalten, Hilfe-Center-Artikeln und mehrsprachigen Rückständen, bei denen niedrige Kosten pro Anfrage wichtiger sind als ein Upgrade auf ein stärkeres Reasoning-Modell.

Klassifikations-, Tagging- und Extraktionswarteschlangen
Ideal für Warteschlangen, die große Mengen an Tickets, Formularen, Katalogdaten, CRM-Notizen oder internen Textdaten labeln, sortieren, normalisieren oder strukturierte Felder extrahieren.

Zusammenfassung und Batch-Textverarbeitung
Nutzen Sie sie als kostengünstige Schicht für die Zusammenfassung langer Texte, Komprimierung repetitiver Inhalte oder Vorverarbeitung von Datensätzen, bevor nur die schwierigeren Fälle an Gemini 2.5 Flash oder Gemini 2.5 Pro weitergeleitet werden.

Wann diese Route wählen
Flash Lite macht am meisten Sinn als kostengünstige Schicht in einer Gemini-Routing-Strategie: ein Gateway, ein Authentifizierungsmuster und eine klarere Trennung zwischen günstiger Massenverarbeitung und stärkeren Gemini-Routen.
Wählen Sie Flash Lite, wenn Kosten und Durchsatz die Entscheidung bestimmen
Wenn die Arbeitslast hauptsächlich Übersetzung, Tagging, Extraktion, Zusammenfassung oder Batch-Textbereinigung umfasst, ist Flash Lite der praktische Startpunkt, da die Stückkosten niedrig bleiben, ohne einen separaten Integrationspfad zu erfordern.
Flash Lite nicht standardmäßig für schwierige Reasoning-Aufgaben verwenden
Flash Lite ist nicht die Route, auf die Sie Ihren Stack zentrieren sollten, wenn die Qualitätsschwelle höher ist, der Reasoning-Pfad komplexer wird oder zu viele Randfälle eine günstige Erstverarbeitungsschicht durchlaufen.
Upgrade auf Gemini 2.5 Flash oder Pro, wenn Qualität wichtiger als Preis ist
Wechseln Sie zu Gemini 2.5 Flash für eine stärkere Allzweckroute oder zu Gemini 2.5 Pro, wenn die Aufgabe ein leistungsfähigeres Premium-Modell rechtfertigt. EvoLink macht diese Routing-Aufteilung einfacher zu betreiben.
So starten Sie
Nutzen Sie diese Seite als schnelle Routenanleitung: Wählen Sie das Anfrageformat, verwenden Sie die korrekte Modell-ID und behalten Sie die detaillierte Anfragesyntax in der Dokumentation.
Schritt 1 – Anfrageformat wählen
Rufen Sie Gemini 2.5 Flash Lite über OpenAI-kompatible Anfragen oder native Gemini-Anfragen auf, abhängig von dem Stack, den Sie bereits verwenden.
Schritt 2 – Korrekte Modell-ID verwenden
Verwenden Sie die Anfrage-Modell-ID "gemini-2.5-flash-lite" für diese Route.
Schritt 3 – Die richtigen Arbeitslasten hierher leiten
Verwenden Sie Flash Lite für Übersetzung, Klassifikation, Extraktion, Tagging, Zusammenfassung und Batch-Textverarbeitung. Steigen Sie nur auf, wenn die Aufgabe eine stärkere Gemini-Route erfordert.
Kernfähigkeiten und Limits
Die wichtigsten Limits und Produktionssignale, die bei der Entscheidung zählen, ob diese Route zu Ihrer Arbeitslast passt
1.048.576 Eingabe-Token
Unterstützt bis zu 1.048.576 Eingabe-Token für lange Prompts, große Dokumente und Batch-Textverarbeitung.
65.536 maximale Ausgabe-Token
Am besten geeignet für kompakte Ausgaben wie Labels, Zusammenfassungen, extrahierte Felder und Textantworten.
Text + Audio Eingabe, Text Ausgabe
Akzeptiert Text- und Audio-Eingabe, mit Textausgabe für Transkriptions-nahe und Textverarbeitungs-Workflows.
Implizites Caching
Wiederholter Kontext kann von implizitem Caching profitieren, was die Kosten bei überlappenden Anfragen reduziert.
Batch API
Unterstützt Batch API für Warteschlangen-, Offline- oder andere Hochvolumen-Verarbeitungsmuster.
Kostengünstigste Gemini-Textroute
Positioniert unterhalb von Gemini 2.5 Flash in Fähigkeit und Preis, was sie zur praktischen Budget-Schicht für Massentext-Arbeitslasten macht.
Gemini 2.5 Flash Lite API FAQs
Everything you need to know about the product and billing.
Nächste Schritte für Gemini-Routing
Wo Flash Lite in die Gemini-Familie passt
Verwenden Sie Flash Lite für Massentextverarbeitung, wechseln Sie zu Gemini 2.5 Flash, wenn Sie eine stärkere Allzweckroute benötigen, und zu Gemini 2.5 Pro, wenn die Aufgabe Premium-Reasoning-Qualität rechtfertigt.
Nutzen Sie diesen Bereich, um zur richtigen Gemini-Route oder zur Dokumentation zu wechseln, sobald die Rolle von Flash Lite in Ihrem Stack klar ist.