Sigurnost umjetne inteligencije ponovno je pod povećalom nakon što su istraživači britanske tvrtke Mindgard objavili da su uspjeli navesti ChatGPT na generiranje nasilnih i seksualiziranih slika unatoč zaštitnim mehanizmima koje je uveo OpenAI.
Prema njihovim navodima, bilo je dovoljno izmijeniti postojeći tekstualni upit kako bi sustav počeo stvarati sadržaje koji prema pravilima platforme ne bi smjeli biti dostupni korisnicima.
Nakon upozorenja istraživača, OpenAI je priznao problem te objavio da je uveo dodatne zaštitne mjere kako bi spriječio takve pokušaje. Iz tvrtke navode kako sustav koristi kombinaciju automatiziranih sigurnosnih mehanizama i ljudskog nadzora radi blokiranja zabranjenog sadržaja.
No istraživači tvrde da su i nakon novih ograničenja pronašli alternativne načine za zaobilaženje zaštita.
Posebno zabrinjava činjenica da se problem pojavio kod jednog od najnaprednijih sustava umjetne inteligencije na svijetu, koji svakodnevno koriste milijuni ljudi. Stručnjaci upozoravaju da razvoj umjetne inteligencije daleko nadmašuje brzinu kojom se razvijaju sigurnosni mehanizmi i regulatorni okviri.
Britanski stručnjaci navode kako je riječ o još jednom upozorenju da tehnološke kompanije nemaju potpunu kontrolu nad ponašanjem vlastitih modela. Svaka nova zaštita vrlo brzo dovodi do pokušaja njezina zaobilaženja, što stvara stalnu utrku između razvoja umjetne inteligencije i sigurnosnih sustava.
Tema postaje još osjetljivija zbog sve veće prisutnosti umjetne inteligencije u obrazovanju, poslovanju, medijima i svakodnevnom životu. Brojne države već pripremaju nova pravila kojima bi se pojačao nadzor nad AI sustavima, posebno kada je riječ o zaštiti djece, privatnosti i sprječavanju zlouporaba.
Objava britanskih istraživača pokazuje da rasprava o umjetnoj inteligenciji više nije samo pitanje tehnološkog napretka. Sve više postaje pitanje odgovornosti, sigurnosti i kontrole nad alatima koji imaju golem utjecaj na društvo.



