Perché il deep learning moderno potrebbe rendere difficile l’allineamento delle IA

Ajeya Cotra

Effective Altruism Forum, January 17, 2023

Abstract

Il problema dell’allineamento del deep learning consiste nel garantire che i modelli avanzati di apprendimento profondo non perseguano obiettivi pericolosi. Questo articolo approfondisce l’analogia con l’“assunzione” per illustrare come l’allineamento potrebbe essere difficile se i modelli di apprendimento profondo fossero più capaci degli esseri umani. Spiega poi in modo più tecnico e dettagliato in cosa consiste il problema dell’allineamento del deep learning. Infine, discute quanto possa essere difficile il problema dell’allineamento e quanto sia rischioso non risolverlo.