works
Ajeya Cotra Zašto bi usklađivanje veštačke inteligencije moglo biti teško uz moderno duboko učenje online Problem usklađivanja dubokog učenja jeste problem osiguranja da napredni modeli dubokog učenja ne teže opasnim ciljevima. Ovaj članak razrađuje analogiju “zapošljavanja” kako bi ilustrovao zašto usklađivanje može biti teško ako su modeli dubokog učenja sposobniji od ljudi. Zatim tehnički detaljnije objašnjava šta je problem usklađivanja dubokog učenja. Na kraju, raspravlja o tome koliko težak može biti problem usklađivanja i koliko rizika postoji u slučaju neuspeha u njegovom rešavanju.

Abstract

Problem usklađivanja dubokog učenja jeste problem osiguranja da napredni modeli dubokog učenja ne teže opasnim ciljevima. Ovaj članak razrađuje analogiju “zapošljavanja” kako bi ilustrovao zašto usklađivanje može biti teško ako su modeli dubokog učenja sposobniji od ljudi. Zatim tehnički detaljnije objašnjava šta je problem usklađivanja dubokog učenja. Na kraju, raspravlja o tome koliko težak može biti problem usklađivanja i koliko rizika postoji u slučaju neuspeha u njegovom rešavanju.