Recherche technique sur la sûreté de l'IA
Altruisme Efficace, 2025
Abstract
L’intelligence artificielle aura des effets transformateurs sur la société au cours des prochaines décennies et pourrait apporter d’énormes avantages — mais nous pensons aussi qu’il existe un risque substantiel. Un moyen prometteur de réduire les chances d’une catastrophe liée à l’IA est de trouver des solutions techniques qui pourraient nous permettre d’empêcher les systèmes d’IA d’adopter un comportement dangereux.