Tag Archives: Désalignement émergent

Le désalignement émergent dans les Large Language Models

Publié le 2 juillet 2025 par Me Philippe Ehrenström

Objectif : tester si l’apprentissage d’un comportement nuisible dans un domaine restreint (le code) pouvait influencer défavorablement la conduite du Large Language Model dans des contextes complètement différents. Spoiler: on dirait bien que oui. Lire la suite →

Publié dans intelligence artificielle, Protection des données | Tagué Désalignement émergent, Emergent Misalignment, intelligence artificielle, LLMs | Laisser un commentaire

Tag Archives: Désalignement émergent

Le désalignement émergent dans les Large Language Models

Articles récents

Catégories

Méta

S'abonner au blog via courriel