Zašto bi usklađivanje veštačke inteligencije moglo biti teško uz moderno duboko učenje
Effective Altruism Serbia, September 7, 2023
Abstract
Problem usklađivanja dubokog učenja jeste problem osiguranja da napredni modeli dubokog učenja ne teže opasnim ciljevima. Ovaj članak razrađuje analogiju “zapošljavanja” kako bi ilustrovao zašto usklađivanje može biti teško ako su modeli dubokog učenja sposobniji od ljudi. Zatim tehnički detaljnije objašnjava šta je problem usklađivanja dubokog učenja. Na kraju, raspravlja o tome koliko težak može biti problem usklađivanja i koliko rizika postoji u slučaju neuspeha u njegovom rešavanju.