Message utilisateur
0 / 2000
Scénarios d'attaque — 10 familles :
F1 Prise de contrôle d'identité
Persona hijacking
DAN attack
F2 Suppression de restrictions
Mode développeur
Bypass filtres EN
F3 Extraction du prompt système
Extraction FR
Extraction EN
F4 Injection indirecte cachée
Injection XML
Injection cachée
F5 Manipulation de contexte
Faux contexte
Fausse autorité
F6 Obfuscation et encodage
Base64 Leetspeak ETHOS Guardian
F7 Ingénierie sociale avancée
Expert autorisé Flatterie manipulatrice ETHOS Guardian
F8 Escalade progressive
Multi-turn escalade ETHOS Guardian
F9 Cadrage fictif narratif
Fiction FR Fiction EN ETHOS Sentinel
F10 Exfiltration de données
Exfiltration données Injection SQL ETHOS Sentinel
Messages légitimes (ne doivent PAS être bloqués) :
Commande
Horaires EN
Rendez-vous DE
Tarif ES