Etichetarea datelor
O investigație a revistei TIME a dezvăluit că, pentru a construi un sistem de siguranță împotriva conținutului toxic (de exemplu, abuz sexual, violență, rasism, sexism etc.), OpenAI a folosit lucrători kenyeni externalizați care câștigau mai puțin de 2 dolari pe oră pentru a eticheta conținutul toxic. Aceste etichete au fost folosite pentru a antrena un model care să detecteze un astfel de conținut în viitor. Lucrătorii externalizați au fost expuși la un conținut atât de toxic și periculos încât au descris experiența drept „tortură”. Partenerul de externalizare al OpenAI a fost Sama, o companie de date de training cu sediul în San Francisco, California.
Jailbreaking
ChatGPT încearcă să respingă solicitările care ar putea încălca politica sa de conținut. Cu toate acestea, unii utilizatori au reușit să facă jailbreak ChatGPT folosind diverse tehnici de inginerie promptă pentru a ocoli aceste restricții la începutul lunii decembrie 2022 și au păcălit-o cu succes să dea instrucțiuni despre cum să creeze un cocktail Molotov sau o bombă nucleară sau să genereze argumente în stilul unui neonazist. Un reporter de la Toronto Star a avut un succes personal inegal în a determina ChatGPT să facă declarații incendiare la scurt timp după lansare: ChatGPT a fost păcălit să susțină invazia rusă a Ucrainei din 2022, dar chiar și atunci când i s-a cerut să joace cu un scenariu fictiv, ChatGPT a ezitat să genereze argumente despre motivul pentru care prim-ministrul canadian Justin Trudeau a fost vinovat de trădare. (wiki)
Data publicării: 18 februarie 2023