sanitize Query
Bereinigt eine Suchanfrage, indem personenbezogene Daten (PII) und Identifikatoren entfernt werden Das sollte nicht an eine externe Suchmaschine weitergeleitet werden. Dient als zweite Verteidigungsschicht Zusätzlich zu möglichen Anweisungen in der Eingabeaufforderung zum Modell, um sensible Einbeziehungen zu vermeiden Informationen in der Abfrage.
Streifen:
Seriennummern (
S/N...,SN:...,s/n...)Fallbezüge / Aktenzeichen („Az.“, „Az:“, „Aktenzeichen“)
Generische alphanumerische IDs, die wie Codes aussehen (6+ Zeichen mit gemischten Buchstaben/Ziffern/Bindestrichen)
„es sei denn/außer/nicht“-Klauseln, die sich typischerweise auf bestimmte Personen beziehen
E-Mail-Adressen
Telefonnummern (internationale und lokale Formate)
IBAN, nationale ID-Nummern im SSN-Stil
Geburtsdatumsmuster („DOB:“, „Geboren am“, „Geb.“)
Straßenadressen (Hausnummer + Straßenname, EN/DE)
Nachgestelltes Rauschen (Leerzeichen, Kommas, Punkte)
In „<< WORD >>“ eingeschlossene Wörter umgehen alle Siebregeln und werden wörtlich beibehalten.
Return
Parameters
The raw query string to sanitize.
Optional language code (e.g. "en", "de") to help with language-specific Muster (z. B. Namenserkennung). Wenn null, werden nur generische Muster angewendet
Per-request override for filterResults. When non-null, takes precedence über das globale filterResults-Flag.