sanitizeQuery

fun sanitizeQuery(raw: String, language: String? = null, filterOverride: Boolean? = null): String

Disinfetta una query di ricerca rimuovendo le informazioni di identificazione personale (PII) e gli identificatori che non devono essere inoltrati a un motore di ricerca esterno. Serve come secondo livello di difesa oltre alle possibili istruzioni nel prompt al modello per evitare di includere dati sensibili informazioni nella query.

Strisce:

  • Numeri di serie (S/N..., SN:..., s/n ...)

  • Riferimenti di casi / Aktenzeichen (Az., Az:, Aktenzeichen)

  • ID alfanumerici generici che assomigliano a codici (6+ caratteri con lettere/cifre/trattini misti)

  • Clausole "a meno che / tranne / non" che in genere fanno riferimento a persone specifiche

  • Indirizzi e-mail

  • Numeri di telefono (formati internazionali e locali)

  • IBAN, numeri di carta d'identità nazionali in stile SSN

  • Modelli di data di nascita (DOB:, born on, Geb.)

  • Indirizzi stradali (numero civico + nome della strada, EN/DE)

  • Rumore finale (spazi bianchi, virgole, punti)

Le parole racchiuse in << PAROLA >> ignorano tutte le regole del filtro e vengono mantenute alla lettera.

Return

Il santiazizzato raw-String.

Parameters

raw

The raw query string to sanitize.

language

Optional language code (e.g. "en", "de") to help with language-specific modelli (ad esempio rilevamento del nome). Se null, vengono applicati solo i modelli generici

filterOverride

Per-request override for filterResults. When non-null, takes precedence sul flag globale filterResults.