HappyHorse 1.0 kommt baldMehr erfahren

Gemini 2.5 Flash Lite API

Nutzen Sie Gemini 2.5 Flash Lite auf EvoLink über OpenAI-kompatible oder native Gemini-Anfragen. Diese Route ist für günstige, hochvolumige Textarbeitslasten positioniert, bei denen Kostenkontrolle wichtiger ist als der Wechsel zu einem stärkeren Gemini-Modell.
Preis: 

$0.081(~ 5.8 credits) per 1M input tokens; $0.321(~ 23.1 credits) per 1M output tokens

$0.0083(~ 0.6 credits) per 1M cache read tokens; $0.240(~ 17.3 credits) per 1M audio tokens

Google Search grounding charged separately per query.

Höchste Stabilität mit garantierter 99,9% Verfügbarkeit. Empfohlen für Produktionsumgebungen.

Für alle Versionen wird derselbe API-Endpunkt verwendet. Nur der model-Parameter unterscheidet sich.

Gemini 2.5 Flash Lite API

Gemini 2.5 Flash Lite ist Googles kostengünstigste Gemini-Textroute auf EvoLink. Nutzen Sie sie für Übersetzung, Klassifikation, Extraktion, Tagging und Zusammenfassung in großem Umfang, wenn niedrige Token-Kosten wichtiger sind als ein Upgrade auf Gemini 2.5 Flash oder Pro.

Seiten-Keyword

Gemini 2.5 Flash Lite API

Anfrage-Modell-ID

gemini-2.5-flash-lite

Gemini 2.5 Flash Lite API

Optimale Einsatzbereiche

Übersetzungs- und Lokalisierungspipelines

Verwenden Sie Flash Lite für große Mengen an Produkttexten, Support-Inhalten, Hilfe-Center-Artikeln und mehrsprachigen Rückständen, bei denen niedrige Kosten pro Anfrage wichtiger sind als ein Upgrade auf ein stärkeres Reasoning-Modell.

Übersetzungs- und Lokalisierungspipelines

Klassifikations-, Tagging- und Extraktionswarteschlangen

Ideal für Warteschlangen, die große Mengen an Tickets, Formularen, Katalogdaten, CRM-Notizen oder internen Textdaten labeln, sortieren, normalisieren oder strukturierte Felder extrahieren.

Klassifikations-, Tagging- und Extraktionswarteschlangen

Zusammenfassung und Batch-Textverarbeitung

Nutzen Sie sie als kostengünstige Schicht für die Zusammenfassung langer Texte, Komprimierung repetitiver Inhalte oder Vorverarbeitung von Datensätzen, bevor nur die schwierigeren Fälle an Gemini 2.5 Flash oder Gemini 2.5 Pro weitergeleitet werden.

Zusammenfassung und Batch-Textverarbeitung

Wann diese Route wählen

Flash Lite macht am meisten Sinn als kostengünstige Schicht in einer Gemini-Routing-Strategie: ein Gateway, ein Authentifizierungsmuster und eine klarere Trennung zwischen günstiger Massenverarbeitung und stärkeren Gemini-Routen.

Wählen Sie Flash Lite, wenn Kosten und Durchsatz die Entscheidung bestimmen

Wenn die Arbeitslast hauptsächlich Übersetzung, Tagging, Extraktion, Zusammenfassung oder Batch-Textbereinigung umfasst, ist Flash Lite der praktische Startpunkt, da die Stückkosten niedrig bleiben, ohne einen separaten Integrationspfad zu erfordern.

Flash Lite nicht standardmäßig für schwierige Reasoning-Aufgaben verwenden

Flash Lite ist nicht die Route, auf die Sie Ihren Stack zentrieren sollten, wenn die Qualitätsschwelle höher ist, der Reasoning-Pfad komplexer wird oder zu viele Randfälle eine günstige Erstverarbeitungsschicht durchlaufen.

Upgrade auf Gemini 2.5 Flash oder Pro, wenn Qualität wichtiger als Preis ist

Wechseln Sie zu Gemini 2.5 Flash für eine stärkere Allzweckroute oder zu Gemini 2.5 Pro, wenn die Aufgabe ein leistungsfähigeres Premium-Modell rechtfertigt. EvoLink macht diese Routing-Aufteilung einfacher zu betreiben.

So starten Sie

Nutzen Sie diese Seite als schnelle Routenanleitung: Wählen Sie das Anfrageformat, verwenden Sie die korrekte Modell-ID und behalten Sie die detaillierte Anfragesyntax in der Dokumentation.

1

Schritt 1 – Anfrageformat wählen

Rufen Sie Gemini 2.5 Flash Lite über OpenAI-kompatible Anfragen oder native Gemini-Anfragen auf, abhängig von dem Stack, den Sie bereits verwenden.

2

Schritt 2 – Korrekte Modell-ID verwenden

Verwenden Sie die Anfrage-Modell-ID "gemini-2.5-flash-lite" für diese Route.

3

Schritt 3 – Die richtigen Arbeitslasten hierher leiten

Verwenden Sie Flash Lite für Übersetzung, Klassifikation, Extraktion, Tagging, Zusammenfassung und Batch-Textverarbeitung. Steigen Sie nur auf, wenn die Aufgabe eine stärkere Gemini-Route erfordert.

Kernfähigkeiten und Limits

Die wichtigsten Limits und Produktionssignale, die bei der Entscheidung zählen, ob diese Route zu Ihrer Arbeitslast passt

Kontext

1.048.576 Eingabe-Token

Unterstützt bis zu 1.048.576 Eingabe-Token für lange Prompts, große Dokumente und Batch-Textverarbeitung.

Ausgabe

65.536 maximale Ausgabe-Token

Am besten geeignet für kompakte Ausgaben wie Labels, Zusammenfassungen, extrahierte Felder und Textantworten.

Eingabe

Text + Audio Eingabe, Text Ausgabe

Akzeptiert Text- und Audio-Eingabe, mit Textausgabe für Transkriptions-nahe und Textverarbeitungs-Workflows.

Caching

Implizites Caching

Wiederholter Kontext kann von implizitem Caching profitieren, was die Kosten bei überlappenden Anfragen reduziert.

Skalierung

Batch API

Unterstützt Batch API für Warteschlangen-, Offline- oder andere Hochvolumen-Verarbeitungsmuster.

Preise

Kostengünstigste Gemini-Textroute

Positioniert unterhalb von Gemini 2.5 Flash in Fähigkeit und Preis, was sie zur praktischen Budget-Schicht für Massentext-Arbeitslasten macht.

Gemini 2.5 Flash Lite API FAQs

Everything you need to know about the product and billing.

Ja. Flash Lite ist sowohl im Preis als auch in der Leistung unterhalb von Gemini 2.5 Flash positioniert und für kostengünstige Massentext-Arbeitslasten gedacht.
Ja. EvoLink unterstützt sowohl OpenAI-kompatible Anfragen als auch native Gemini-Anfragen für diese Route.
Verwenden Sie "gemini-2.5-flash-lite" als Anfrage-Modell-ID.
Gemini 2.5 Flash Lite unterstützt bis zu 1.048.576 Eingabe-Token und bis zu 65.536 Ausgabe-Token.
Ja. Diese Route unterstützt Text- und Audio-Eingabe mit Textausgabe.
Implizites Caching kann wiederholte Token-Kosten reduzieren, wenn Anfragen überlappenden Kontext teilen, was besonders nützlich für wiederkehrende Prompts und Batch-Arbeitslasten ist.
Wählen Sie Flash Lite, wenn Übersetzung, Tagging, Extraktion, Zusammenfassung und andere hochvolumige Textaufgaben die niedrigsten praktischen Kosten erfordern. Steigen Sie auf Flash um, wenn Sie eine stärkere Allzweckroute benötigen.
Es ist am besten geeignet für Übersetzung, Klassifikation, Extraktion, Tagging, Zusammenfassung und andere Batch-Textverarbeitungsarbeitslasten, bei denen Kosten und Durchsatz wichtiger sind als standardmäßig ein stärkeres Modell zu verwenden.
Ja. Gemini 2.5 Flash Lite unterstützt Function Calling, ist aber in der Regel am besten als kostengünstige Textroute positioniert und nicht als stärkste Option für die schwierigsten tool-intensiven Reasoning-Aufgaben.

Nächste Schritte für Gemini-Routing

Wo Flash Lite in die Gemini-Familie passt

Verwenden Sie Flash Lite für Massentextverarbeitung, wechseln Sie zu Gemini 2.5 Flash, wenn Sie eine stärkere Allzweckroute benötigen, und zu Gemini 2.5 Pro, wenn die Aufgabe Premium-Reasoning-Qualität rechtfertigt.

Nutzen Sie diesen Bereich, um zur richtigen Gemini-Route oder zur Dokumentation zu wechseln, sobald die Rolle von Flash Lite in Ihrem Stack klar ist.