Anthropic lance "Body Constitution Classifier": Bloque avec succès 95% des tentatives de modèle de jailbreak - IRC.
La société d'intelligence artificielle Anthropic a récemment annoncé le développement d'une nouvelle méthode de sécurité appelée "Constitution Body Constitution" visant à protéger les modèles de langage contre la manipulation malveillant
2025-02-16