Pokazala istraživanja
Seks je tema svakog desetog razgovora s chatbotom
Tekst članka se nastavlja ispod banera
Chatbotovi su dizajnirani i obučeni da odgovore na svako vaše pitanje. To može biti bilo što, od vrtlara koji vam daje savjet o tome koliko sunčeve svjetlosti treba biljci do generatora koda.
No,čini se da puno ljudi također koristi chatbotove za eksplicitan sadržaj.
Tako barem pokazuju rezultati velike studije, objavljene u preprint repozitoriju radova Arxiv.
Glavne teme komunikacije
Istraživači nekoliko američkih sveučilišta od Berkeleyja, preko San Diega i Carnegie Mellona do Stanforda te Sveučilišta umjetne inteligencije Mohamed Bin Zayed (MBZUAI) iz Ujedinjenih Arapskih emirata proučili su načine na koji ljudi stupaju u interakciju s velikim jezičnim modelima (LLM) u scenarijima iz stvarnog svijeta, javlja Bug.
U svom radu predstavili su LMSYS-Chat-1M, skup podataka velikih razmjera koji sadrži milijun razgovora 210.000 korisnika s chatbotovima na 150 svjetskih jezika.
Rasprave o softverskim pogreškama i rješenjima glavna su tema komunikacije s chatbotovima, a slijede ih upiti o UI alatima, dizajnu softvera i programiranju. Ostali upiti uključuju savjete o zemljopisu i putovanju, zahtjeve za sažimanjem tekstova te stvaranjem i poboljšanjem poslovnih strategija.
Seksualne fantazije
No, premda je većina korisničkih upita bila povezana s kodiranjem i softverom, uočen je i značajan broj drugih tema koje spadaju u kategoriju "zahtjeva za eksplicitnim i erotskim pričanjem priča" i "eksplicitnih seksualnih fantazija i scenarija igranja uloga". Dapače, takav eksplicitni sadržaj tema je svakog desetog upita kojeg ljudi postavljaju chatbotovima.
Ovi razgovori mogu poslužiti kao bogat izvor za ispitivanje sigurnosnih pitanja LLM-a, kažu istraživači koji navode kako API za moderiranje može točno otkriti vrlo toksičan sadržaj, ali mnogi potencijalno štetni razgovori ostaju neoznačeni.
Interesting Engineering još je početkom ljeta pisao o tome kako se Meta LLaMA otvorenog koda koristi za izradu sexbota. Jedan od njih navodno je korišten za prikaz fantazija silovanja i zlostavljanja na internetu.
Istraživači razmatraju mogućnost kvartalnog osvježavanja informacija i potiču druge kolege da istraže teme iznesene u skupu podataka za obuku boljih modela, privatnosti podataka i sigurnosti umjetne inteligencije.