guide

Leitfaden zur Image Moderation API: So filtern Sie unsichere, vom Benutzer hochgeladene Bilder

EvoLink Team

Product Team

29. April 2026

10 Min. Lesezeit

Eine Image Moderation API hilft Ihnen, unsichere oder unerwünschte visuelle Inhalte zu erkennen, bevor sie die Benutzer erreichen. Für Anwendungen mit vom Benutzer hochgeladenen Bildern bedeutet das in der Regel die Prüfung von Avataren, Forenbeiträgen, Marktplatz-Fotos, Chat-Anhängen oder KI-generierten Bildern auf Inhalte wie sexuelles Material, Gewalt, Selbstverletzung, explizite Darstellungen oder andere Richtlinienverstöße.

Die Schwierigkeit liegt nicht im API-Aufruf. Die Schwierigkeit liegt in der Gestaltung des Upload-Workflows drumherum.

Dieser Leitfaden erklärt, wo Image Moderation zum Einsatz kommt, was Image APIs erkennen können und was nicht, und wie Sie einen praktischen Workflow für Freigabe / Prüfung / Blockierung mit EvoLink Moderation 1.0 aufbauen.

Zusammenfassung

Setzen Sie Image Moderation ein, wenn öffentliche oder halböffentliche Benutzer Avatare, Beiträge, Marktplatz-Fotos, KI-generierte Bilder oder Nachrichtenanhänge hochladen können.
Führen Sie die Moderation serverseitig durch, bevor Bilder öffentlich sichtbar werden.
Verwenden Sie temporären Speicher und verschieben Sie freigegebene Bilder erst dann in den permanenten Speicher.
Betrachten Sie automatisierte Moderation als erste Ebene, nicht als perfekte Endentscheidung.
Fügen Sie menschliche Prüfung, Benutzer-Meldungen und Einspruchsmöglichkeiten für unklare Fälle hinzu.
EvoLink Moderation unterstützt reine Bild- sowie Text-plus-Bild-Anfragen über einen OpenAI-kompatiblen /v1/moderations Endpoint.

Warum Image Moderation sich von Text Moderation unterscheidet

Text Moderation und Image Moderation lösen verwandte, aber unterschiedliche Probleme.

Text Moderation kann Wörter, Phrasen und Sprachmuster untersuchen. Image Moderation muss Pixel, Objekte, visuellen Kontext und manchmal in ein Bild eingebetteten Text interpretieren.

Das führt zu mehreren Unterschieden:

Aspekt	Text Moderation	Image Moderation
Eingabegröße	Meist klein	Oft deutlich größer
Kontext	Sprache und Konversation	Visuelle Szene, Objekte, OCR, Beschriftungen
Typische Fehler	Sarkasmus, codierte Sprache, Kontextfehler	Kunst, medizinische Bilder, Badebekleidung, Memes, Ausschnitte, Overlays
Auswirkung auf den Workflow	Kommentar wird abgelehnt oder in die Warteschlange gestellt	Hochgeladene Medien erfordern möglicherweise temporären Speicher
Benutzersensibilität	Benutzer kann oft umformulieren	Abgelehnte Profilbilder oder persönliche Bilder können empfindlicher wahrgenommen werden

Deshalb kombiniert ein zuverlässiges Image Moderation System in der Regel eine API mit Produktregeln, Prüfungs-Warteschlangen und Benutzer-Meldungen.

Häufige Anwendungsfälle für Image Moderation

1. Profilbilder und Avatare

Profilbilder sind im gesamten Produkt sichtbar. Sie sind auch leicht zu missbrauchen.

Moderationsprüfungen suchen häufig nach:

sexuellen oder expliziten Darstellungen
grafischer Gewalt
Selbstverletzungsbildern
Hasssymbolen
bedrohlichen oder einschüchternden Darstellungen

Bei Avataren sind False Positives wichtig. Wenn ein normales Profilfoto abgelehnt wird, kann die Benutzererfahrung schnell frustrierend werden. Ein gutes Muster ist, nur hochriskante Bilder automatisch zu blockieren, unsichere Bilder zur Prüfung zu senden und eindeutig risikoarme Bilder freizugeben.

Foren und soziale Plattformen kombinieren häufig Text und Bilder. Eine Beitragsbeschriftung kann die Bedeutung eines Bildes verändern, und ein Bild kann die Bedeutung einer Beschriftung verändern.

Für diese Workflows ist Text-plus-Bild-Moderation nützlich, da die Anwendung beide Teile einer Einreichung vor der Veröffentlichung bewerten kann.

3. Marktplatz-Produktfotos

Image Moderation auf Marktplätzen befasst sich nicht nur mit NSFW-Inhalten. Produktplattformen müssen möglicherweise auch erkennen:

verbotene Artikel
Waffen oder Drogen
Wasserzeichen
Bildqualitätsprobleme
irreführende Fotos
richtlinienrelevante visuelle Aussagen

Für Bildqualitätsprüfungen, OCR, Wasserzeichenerkennung oder spezielle Marktplatzregeln kann ein dedizierter visueller Moderationsdienst wie Sightengine, Amazon Rekognition oder Azure AI Content Safety je nach Workflow nützlich sein.

4. KI-generierte Bilder

KI-generierte Bilder können dennoch gegen Inhaltsrichtlinien verstoßen. Wenn Benutzer Bilder in Ihrer Anwendung generieren oder KI-generierte Assets hochladen, moderieren Sie beides:

den Prompt oder die Beschriftung
das generierte Bild

Dies ist besonders wichtig, wenn die Ergebnisse öffentlich sind, monetarisiert werden oder mit einer markensicheren Erfahrung verbunden sind.

5. Nachrichtenanhänge

Private oder halböffentliche Nachrichten stellen eine schwierigere Produktentscheidung dar, da Moderation sich mit Datenschutzerwartungen überschneidet. Einige Produkte scannen Uploads vor der Zustellung; andere scannen nur gemeldete Inhalte; manche kombinieren clientseitige Warnungen mit serverseitiger Durchsetzung.

Das richtige Design hängt vom Produkt, den rechtlichen Verpflichtungen, der Datenschutzrichtlinie und den Benutzererwartungen ab.

Wie Image Moderation APIs funktionieren

Die meisten Image Moderation APIs folgen dem gleichen grundlegenden Muster:

Sie stellen eine Bild-URL, eine hochgeladene Datei, ein Speicherobjekt oder Bild-Bytes bereit.
Die API analysiert das Bild mit einem oder mehreren Moderation-Modellen.
Die Antwort enthält Kategorielabels, Confidence-Scores oder boolesche Flags.
Ihre Anwendung entscheidet, ob das Bild freigegeben, geprüft oder blockiert wird.

Amazon Rekognition's DetectModerationLabels API gibt beispielsweise Moderation-Labels mit Confidence-Scores und einer hierarchischen Taxonomie zurück. Sightengine's Image Moderation API gibt detaillierte Moderation-Scores für ausgewählte Modelle zurück. OpenAI's Moderation Endpoint gibt Kategorie-Flags und Scores für Text und Bilder zurück, wobei die Bildunterstützung je nach Kategorie variiert.

Quellen:

Empfohlene Upload-Architektur

Für die meisten öffentlichen Anwendungen ist das sicherste Muster:

Benutzer-Upload
  -> temporärer Speicher
  -> Image Moderation API
  -> Freigabe / Prüfung / Blockierung
  -> permanenter Speicher nur bei Freigabe oder nach bestandener Prüfung

Dies verhindert, dass unsichere Bilder öffentlich werden, bevor sie geprüft wurden.

Muster 1: Clientseitige Vorwarnung vor dem Upload

Clientseitige Prüfungen können Benutzer schnell warnen, sollten aber nicht Ihre einzige Durchsetzungsebene sein.

Verwenden Sie clientseitige Prüfungen für:

sofortiges Benutzer-Feedback
Reduzierung offensichtlichen Missbrauchs vor dem Upload
Bandbreiteneinsparung bei risikoarmen Abläufen

Setzen Sie die Richtlinien jedoch immer serverseitig durch, da clientseitige Prüfungen umgangen werden können.

Muster 2: Moderation nach dem Upload, vor der Veröffentlichung

Dies ist das Standard-Produktionsmuster.

Laden Sie das Bild in einen temporären, privaten Speicher hoch.
Senden Sie die Bild-URL an eine Moderation API.
Bei niedrigem Risiko verschieben Sie es in den permanenten Speicher.
Bei mittlerem Risiko stellen Sie es in die Prüfungswarteschlange.
Bei hohem Risiko lehnen Sie es ab und löschen die temporäre Datei.

Muster 3: Asynchrone Moderation

Für vertrauenswürdige Communities oder Workflows mit hohem Volumen können Sie zuerst speichern und im Hintergrund moderieren. Halten Sie in diesem Fall Bilder privat, bis sie freigegeben sind, oder nur für den Hochlader sichtbar, bis die Prüfungen abgeschlossen sind.

EvoLink Moderation als Image Moderation API verwenden

EvoLink Moderation 1.0 unterstützt:

reine Text-Moderation
reine Bild-Moderation
Text-plus-Einzelbild-Moderation

Es verwendet einen OpenAI-kompatiblen /v1/moderations Endpoint und gibt Standard-Moderationsfelder plus evolink_summary zurück.

Die Zusammenfassung ist für Produktentscheidungen konzipiert:

risk_level
flagged
violations
max_score
max_category

Vollständige Anfrage-Beispiele und Limits finden Sie in der EvoLink Moderation API Dokumentation.

Beispiel: Nur Bild

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_EVOLINK_API_KEY",
    base_url="https://api.evolink.ai/v1"
)

response = client.moderations.create(
    model="evolink-moderation-1.0",
    input=[
        {
            "type": "image_url",
            "image_url": {
                "url": "https://example.com/user-upload.jpg"
            }
        }
    ]
)

risk = response.evolink_summary.risk_level

if risk == "high":
    block_image()
elif risk == "medium":
    send_to_review()
else:
    approve_image()

Beispiel: Text plus Bild

response = client.moderations.create(
    model="evolink-moderation-1.0",
    input=[
        {"type": "text", "text": "User caption or message"},
        {
            "type": "image_url",
            "image_url": {
                "url": "https://example.com/user-upload.jpg"
            }
        }
    ]
)

Umgang mit mehreren Bildern

EvoLink Moderation unterstützt ein Bild pro Anfrage. Wenn ein Benutzer mehrere Bilder hochlädt, senden Sie parallele Anfragen oder verarbeiten Sie diese über eine Warteschlange.

def decide_album_status(results):
    risk_order = {"low": 0, "medium": 1, "high": 2}
    highest = max(results, key=lambda r: risk_order[r.evolink_summary.risk_level])
    return highest.evolink_summary.risk_level

In vielen Anwendungen sollte ein hochriskantes Bild die gesamte Einreichung blockieren, während Bilder mit mittlerem Risiko die Einreichung zur Prüfung senden können.

Best Practices für Image Moderation in der Produktion

1. Serverseitig moderieren

Clientseitige Prüfungen können die UX verbessern, aber der Server muss die endgültige Entscheidung treffen. Andernfalls können Benutzer die Prüfung umgehen, indem sie Ihre Upload-API direkt aufrufen.

2. Temporären Speicher verwenden

Veröffentlichen Sie ein hochgeladenes Bild nicht sofort. Speichern Sie es privat, moderieren Sie es und verschieben Sie es erst nach der Freigabe in den öffentlichen Bucket oder das CDN.

3. Abgestufte Entscheidungen verwenden

Vermeiden Sie eine einfache binäre Verzweigung. Ein dreistufiger Workflow gibt Ihnen mehr Kontrolle:

niedriges Risiko: Freigabe
mittleres Risiko: Prüfung
hohes Risiko: Blockierung

4. Spezifisches Benutzer-Feedback geben

Allgemeine Ablehnungsnachrichten verursachen Supportaufwand. Erklären Sie nach Möglichkeit die Kategorie auf hoher Ebene:

„Dieses Bild scheint sexuelle Inhalte zu enthalten."
„Dieses Bild scheint grafische Gewalt zu enthalten."
„Dieses Bild erfordert eine Prüfung vor der Veröffentlichung."

Vermeiden Sie es, genaue Schwellenwerte oder Modellschwächen offenzulegen, die Benutzern helfen könnten, die Moderation zu umgehen.

5. Meldungen und Einsprüche hinzufügen

Kein Modell ist perfekt. Fügen Sie Benutzer-Meldungen und Einspruchsmöglichkeiten hinzu, damit Ihr Team False Positives korrigieren und False Negatives erkennen kann.

6. Moderationsqualität überwachen

Messen Sie:

Ablehnungsrate
Prüfungswarteschlangen-Rate
Prüfer-Überschreibungsrate
Einspruchserfolgsrate
Benutzer-Meldungsrate
Wiederholungstäter-Rate
Latenz und API-Fehlerrate

Diese Zahlen helfen Ihnen, Schwellenwerte zu optimieren und zu entscheiden, wann eine weitere Moderationsebene hinzugefügt werden sollte.

7. Mit realen Inhalten testen

Verwenden Sie anonymisierte oder richtlinienkonforme Beispiele aus Ihrer eigenen Anwendung. Öffentliche Benchmark-Angaben sagen selten voraus, wie sich eine Moderation API bei Ihrer spezifischen Community, Ihrem Marktplatz oder Ihrem Bildstil verhält.

Häufige Fehler

Fehler 1: Annehmen, dass eine API alles erkennt

Image Moderation APIs sind nützlich, aber sie verstehen nicht jede Produktrichtlinie. Sie benötigen möglicherweise weiterhin benutzerdefinierte Regeln für Marktplatzkategorien, Markensicherheit, Urheberrecht, Wasserzeichen oder lokale Compliance.

Fehler 2: Veröffentlichen, bevor die Moderation abgeschlossen ist

Wenn unsichere Bilder auch nur kurz erscheinen können, können Benutzer Screenshots erstellen und diese teilen. Halten Sie Uploads privat, bis die Prüfungen abgeschlossen sind.

Fehler 3: Jedes unsichere Bild blockieren

Zu strenge Schwellenwerte erzeugen False Positives. Senden Sie unklare Inhalte zur Prüfung, anstatt automatisch alles abzulehnen.

Fehler 4: Text rund um das Bild ignorieren

Eine Beschriftung kann die Bedeutung eines Bildes verändern. Wenn Ihr Produkt Beschriftungen erlaubt, moderieren Sie Text und Bild gemeinsam.

Fehler 5: Datenschutz und Aufbewahrung vergessen

Bilder können Gesichter, Dokumente, private Räume oder Minderjährige enthalten. Überprüfen Sie die Datenverarbeitungs-, Aufbewahrungs-, Regions- und Trainingsnutzungsbedingungen Ihres Anbieters vor dem Produktiveinsatz.

Wann Sie einen spezialisierten Image Moderation Anbieter einsetzen sollten

EvoLink Moderation eignet sich gut für Text- und Bildsicherheitsentscheidungen innerhalb eines OpenAI-kompatiblen API-Workflows.

Erwägen Sie einen spezialisierten Bildanbieter wie Sightengine, Amazon Rekognition oder Azure AI Content Safety, wenn Sie Folgendes benötigen:

OCR-intensive Moderation
Wasserzeichenerkennung
Gesichtserkennung
Deepfake-Erkennung
Video Moderation
Livestream-Moderation
benutzerdefinierte visuelle Klassen
Cloud-native Integration mit AWS oder Azure

Die richtige Antwort kann ein mehrschichtiger Stack sein: EvoLink für Text-plus-Bild-Sicherheits-Routing, plus ein spezialisierter visueller Dienst für Bildqualität, OCR oder marktplatzspezifische Prüfungen.

FAQ

Was ist eine Image Moderation API?

Eine Image Moderation API analysiert Bilder und gibt Sicherheitssignale wie Kategorielabels, Confidence-Scores oder Risikostufen zurück. Anwendungen nutzen diese Signale, um hochgeladene Bilder freizugeben, zu prüfen oder zu blockieren.

Unterstützt EvoLink Moderation Image Moderation?

Ja. EvoLink Moderation 1.0 unterstützt reine Bild-Anfragen und Text-plus-Einzelbild-Anfragen über einen OpenAI-kompatiblen Moderation Endpoint.

Kann ich mehrere Bilder in einer EvoLink-Anfrage moderieren?

Nein. EvoLink Moderation unterstützt ein Bild pro Anfrage. Für mehrere Bilder senden Sie parallele Anfragen oder verwenden eine Warteschlange.

Sollte ich Bilder vor oder nach dem Upload moderieren?

Verwenden Sie zunächst temporären Upload-Speicher, moderieren Sie serverseitig und verschieben Sie freigegebene Bilder dann in den permanenten Speicher. So wird verhindert, dass unsichere Bilder öffentlich werden, bevor die Prüfungen abgeschlossen sind.

Reicht Image Moderation für einen Marktplatz aus?

In der Regel nicht allein. Marktplätze benötigen häufig Sicherheitsprüfungen plus Qualitätsregeln, Prüfungen auf verbotene Artikel, OCR, Wasserzeichenerkennung und menschliche Prüfung.