sanitizeQuery

fun sanitizeQuery(raw: String, language: String? = null, filterOverride: Boolean? = null): String

Bereinigt eine Suchanfrage, indem personenbezogene Daten (PII) und Identifikatoren entfernt werden Das sollte nicht an eine externe Suchmaschine weitergeleitet werden. Dient als zweite Verteidigungsschicht Zusätzlich zu möglichen Anweisungen in der Eingabeaufforderung zum Modell, um sensible Einbeziehungen zu vermeiden Informationen in der Abfrage.

Streifen:

  • Seriennummern (S/N..., SN:..., s/n...)

  • Fallbezüge / Aktenzeichen („Az.“, „Az:“, „Aktenzeichen“)

  • Generische alphanumerische IDs, die wie Codes aussehen (6+ Zeichen mit gemischten Buchstaben/Ziffern/Bindestrichen)

  • „es sei denn/außer/nicht“-Klauseln, die sich typischerweise auf bestimmte Personen beziehen

  • E-Mail-Adressen

  • Telefonnummern (internationale und lokale Formate)

  • IBAN, nationale ID-Nummern im SSN-Stil

  • Geburtsdatumsmuster („DOB:“, „Geboren am“, „Geb.“)

  • Straßenadressen (Hausnummer + Straßenname, EN/DE)

  • Nachgestelltes Rauschen (Leerzeichen, Kommas, Punkte)

In „<< WORD >>“ eingeschlossene Wörter umgehen alle Siebregeln und werden wörtlich beibehalten.

Return

Der santiazed raw-String.

Parameters

raw

The raw query string to sanitize.

language

Optional language code (e.g. "en", "de") to help with language-specific Muster (z. B. Namenserkennung). Wenn null, werden nur generische Muster angewendet

filterOverride

Per-request override for filterResults. When non-null, takes precedence über das globale filterResults-Flag.