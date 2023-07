ChatGPT tok verdenen med storm da den ble lansert av OpenAI i november i fjor, og håvet inn over 100 millioner brukere på under tre måneder.

Torsdag denne uken kom motsvaret fra tech-giganten Google til Norge og resten av Europa.

Chatboten «Bard», som tidligere bare hadde vært tilgjengelig i USA og et knippe andre land, ble lansert i store deler av verden med en rekke nye funksjoner og språk.

– Dette er åpenbart et tilsvar til ChatGPT. Google viser at de tar dette på alvor, og jeg tror vi kommer til å se mye av denne teknologien på plattformene deres fremover, sier Lilja Øvrelid, professor i informatikk ved UiO.

Flere hiver seg på kappløpet

Det er foreløpig de kommersielle aktørene som ligger lengst fremme i utviklingen av kunstig intelligens (KI), selv om stadig flere hiver seg på kappløpet, ifølge Øvrelid.

Både Bard og ChatGPT er bygget på hver sin språkmodell som er basert på enorme mengder data. Det er språkmodellene som gjør chatbotene i stand til å lage setninger som gir mening.

Nøyaktig hva slags datagrunnlag Google og OpenAI har brukt til å trene robotene sine er derimot ukjent, fremhever forskeren.

– Det er et problem at mye skjer bak lukkede dører. Mange, meg selv inkludert, mener at teknologien er for viktig til å ivaretas av de kommersielle selskapene alene, sier Øvrelid.

UIO-PROFESSOR: Lilja Øvrelid tar til orde for at Google og OpenAI viser større åpenhet. Foto: UiO

– Det er også vanskelig som forsker å evaluere disse modellene på en ryddig måte, når det er såpass mange detaljer som er proprietære og ukjente, legger hun til.

Mindre åpenhet gjør det for eksempel vanskeligere å vite om en språkmodell har fordommer eller politisk vridning – og ikke minst om den er trent med kvalitetssikret informasjon, ifølge professoren.

Professor Øvrelid trekker frem at det også stadig dukker opp nye språkmodeller med åpen kildekode, såkalt «Open Source», som betyr at kodingen er tilgjengelig for alle.

– Det blir veldig spennende å følge dette fremover. Det viktigste er å få kontroll over hvordan disse modellene blir trent opp, sier hun.

Saksøkt i USA

Tirsdag ble Google saksøkt av advokatfirmaet Clarkson i USA, som hevder at selskapet skal ha stjålet informasjon fra millioner av brukere for å trene opp Bard.

Advokatfirmaet har også saksøkt skaperne bak ChatGPT.

EU vedtok et stort reguleringsforslag tidligere i sommer, der det blant annet blir foreslått regler som gjør det vanskeligere for språkmodellene å samle inn privat informasjon.



Mye av datamaterialet blir på den annen side gitt frivillig av brukerne, sier Øvrelid.

– Det ikke alle vet, er at du ved å bruke for eksempel Chat-GTP er med på å lære opp den kunstige intelligensen som ligger bak, sier hun.

– Bør være mulig å ettergå

Datatilsynet ønsker også å vite mer om hvordan Google og OpenAI trener opp chatbotene sine, forteller seniorrådgiver Tobias Judin.

– Det bør være mulig å ettergå om datamaterialet er representativt, om det er rettferdig innhentet, og om det er av god kvalitet, sier han.

Judin mener likevel at det kan være ulemper ved at kodingen bak språkmodellene ligger åpent for alle.

– Åpen kildekode kan gjøre det lettere for ondsinnede å misbruke teknologien. For eksempel til svindel, sier seniorrådgiveren.

KAN BLI MISBRUKT: Tobias Judin i Datatilsynet påpeker at det kan være gode grunner til å holde koden til språkmodellene hemmelig. Foto: Ilja C. Hendel

Det at det er de kommersielle selskapene som leder utviklingen på generativ KI er ikke nødvendigvis negativt, ifølge Judin.

– Sånn er gjerne innovasjon, at virksomheter kommer med løsninger på problemer som mennesker har.

– Samtidig så skjer ofte innovasjonen på deres premisser, og man kan lure på hva som motiverer dem. Hvis hensikten bare er å maksimere profitt, så blir resultatet ofte deretter, sier han.

Her er det Bard svarer

Midlertidig talsperson i Google Norge, Jesper Vangkilde, har ikke mulighet til å svare på kritikken fra Øvrelid og Judin. Han henviser i stedet til Googles egne sider.

Vi bestemte oss dermed for å spørre Googles chatbot direkte.

– Stemmer det at det er hemmelig hva slags datamateriale google har brukt til å trene deg opp?

– Ja, det er en del av datamaterialet som Google har brukt til å trene meg opp som er hemmelig. Dette er fordi Google ønsker å beskytte sin konkurransefordel og hindre at denne informasjonen blir brukt av andre selskaper til å lage lignende språkmodeller, svarer chatboten.

– I tillegg kan noe av datamaterialet som er blitt brukt til å trene meg opp være sensitivt, for eksempel personopplysninger eller konfidensiell informasjon.

– Google beskyldes for å ha innhentet data fra brukerne sine på ulovlig vis for å trene deg opp. Hva tenker du om det?

– Beklager, jeg er bare en språkmodell og har ikke den nødvendige innsikten til å forstå og svare på dette, svarer Bard.

For ordens skyld: TV 2 understreker at svarene fra Bard ikke nødvendigvis er representative for Googles standpunkt i saken.