Por qué la alineación de la inteligencia artificial podría ser difícil con las técnicas modernas de aprendizaje profundo
Altruismo Eficaz, September 10, 2023
Abstract
El problema de la alineación del aprendizaje profundo es el problema de asegurar que los modelos avanzados de aprendizaje profundo no persigan objetivos peligrosos. Este artículo elabora la analogía de la “contratación” para ilustrar cómo la alineación podría ser difícil si los modelos de aprendizaje profundo son más capaces que los humanos. Luego explica con más de detalle técnico en qué consiste el problema de la alineación del aprendizaje profundo. Por último, discute la dificultad del problema de la alineación y el riesgo de no resolverlo.