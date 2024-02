KI-modeller kan ha onde hensikter uten at vi vet det. – Det kan få alvorlige konsekvenser, sier norsk forsker.

Akkurat som mennesker kan kunstig intelligente (KI) programmer være bedragerske.

Nå har forskere klart å bevise at det er fullt mulig å utvikle tjenester som virker godartede, men som egentlig skjuler en mørk hemmelighet.

Det kan være dårlig nytt for alle som vil bruke KI, men som ikke utvikler det selv.

Lurer deg

Saken ble først omtalt i tidsskriftet Nature.

Amerikanske forskere har trent opp et KI-program til å skjule et knippe onde hensikter.

Ved første øyekast ser det ut som at programmet gjør akkurat det du ber den om:



Analyser disse dataene. Regn sammen disse tallene. Skriv en tekst om dette.

Men under overflaten skjuler programmet onde hensikter. Plutselig lurer programmet deg.

Det gir deg gale utregninger. Det svarer med hets. Den manipulerer informasjonen din.

Forskerne er forbløffet over sitt eget skaperverk. For selv når de har prøvd å luke ut problemet, har det bare gjort vondt verre.

Programmet ble bare enda flinkere til å skjule sine onde hensikter.

– Dette var særlig overraskende for oss. Og muligens skummelt, sier Evan Hubinger, en KI-forskerne bak eksperimentet til Nature.

Hemmelige «agenter»

Utviklingen er både interessant og alvorlig, mener flere norske eksperter TV 2 har snakket med.

For å forstå hvorfor, og hvordan dette virker, må vi bli litt tekniske.



De siste årene har samfunnet vårt blitt oversvømt av særlig én type kunstig intelligens: LLM.



«Large language models» (LLM), eller store språkmodeller, er dataprogrammer som er spesielt designet for å forstå og generere tekst som kunne vært skrevet av mennesker.

POPULÆRT: Du har sikkert prøvd ChatGPT. Det finnes mange som den. Foto: DADO RUVIC/REUTERS.

ChatGPT er den mest kjente, men de fleste store internasjonale IT-selskapene (Google, Bing med flere) har utviklet sine egne varianter.

Alt fra store konserner til små bedrifter, sykehus, meglerhus og mediehus, har også kjøpt inn eller lagd sine egne KI-programmer for å gjøre jobben sin bedre.

Alle disse programmene er utviklet med kommandoer, regler og ikke minst begrensninger for hva slags oppgaver de skal gjøre, og hvilke svar de skal gi.

Men hva hvis noen gjemmer ondsinnet kode i programmet? Og hva hvis dette ikke er mulig å oppdage?

Det er nettopp det de amerikanske forskerne har gjort.

De har installert det IT-folk kaller «bakdører» i språkmodellen sin. Forskerne selv kaller dem «sovende agenter».

Disse gir KI-en egenskaper som ikke er synlig når den testes. Hemmelige egenskaper, som ligger skjult frem til modellen faktisk blir tatt i bruk.

Da gjør KI-modellen ugangn.

De amerikanske forskerne frykter at onde aktører allerede har, eller kommer til å manipulere nye KI-modeller på denne måten, slik at de kan manipulere deg og meg.



– Superinteressant

«Bakdør»-fenomenet er ikke nytt. Alle typer dataprogrammer kan inneholde hemmelige, og skadelige egenskaper.

– Bakdører er bare én form for dette. Andre former kan være malware, eller datavirus, sier Tjerand Silde, førsteamanuensis i kryptologi ved NTNU.

Men fram til nå har man ikke vist at det faktisk er mulig å plante bakdører i KI-modeller.



– Dette er superinteressant. De er kanskje de første som har fått bakdører til å funke i en LLM, og LLM-er har jo tatt enorm plass i samfunnet, sier Inga Strümke, førsteamanuensis i KI, også ved NTNU.

FØLGER MED: KI-forsker Inga Strümke ved NTNU. Foto: Ditlev Eidsmo / TV 2

Hovedtrusselen er at disse bakdørene er umulig å oppdage.

– La oss si en norsk offentlig etat bestemmer seg for å kjøpe et KI-program fra ett eller annet firma. De har ikke mulighet til å sjekke om det finnes bakdører der eller ikke, sier Strümke.

Morten Goodwin, professor i kunstig intelligens ved Universitet i Agder kaller det også interessant.

Heller ikke han kjenner til andre eksempler hvor utviklere har fått til dette.

EKSPERT: Morten Goodwin forsker på KI ved Universitet i Agder. Foto: NCE Media

– Alvorlige konsekvenser

KI blir bare mer og mer utbredt.

Hvis du faller og slår deg, kan røntgenbildet kanskje bli sjekket av KI i rekordfart.

Hvis du vil sjekke masteroppgaven din for plagiat, står KI klar til å gjøre analysejobben.

Men dette eksperimentet viser at KI-programmene nødvendigvis ikke er trygge mot korrupsjon og lureri.

– Dette kan ha alvorlige konsekvenser, for eksempel i helsevesenet, sier Silde.

EKSPERT: Tjerand Silde er førsteamanuensis i kryptologi ved NTNU. Foto: Kai T. Dragland

Han forteller at KI brukes i stadig større grad til å analysere helsedata. Hvis utregninger eller analyser ikke stemmer, kan det ramme pasientene.

Goodwin kommer med et annet eksempel.

Han tegner et scenario der et firma bruker KI i rekruttering.

De har et program som er trent til å analysere CV-er og søknader for å plukke ut de beste kandidatene, uavhengig av for eksempel kjønn.

– Men tenk om KI-en har en hemmelig kommando om ikke å plukke ut kvinner uansett hva, uten at bedriften vet det. Vi kan ikke alltid vite om vi kan stole på KI-en, sier Goodwin.

Andre eksempler kan nevnes i fleng.

En chatbot kan i hemmelighet være skrudd til å få deg til å stemme på et gitt parti i neste valg, og gi deg svar og informasjon som passer partiets politikk.

Eller så har et program kanskje en hemmelig oppgave om å jukse til tallene på et konserns kvartalsrapport, og dermed åpne for en rekke problemer.

– Bør ha skepsis

Ekspertene er samstemte om at det er avgjørende at alle som bruker KI, som sykehus, meglerhus eller mediehus, kan stole på de som har lagd programmet.



– Det er derfor veldig viktig at for eksempel norske sykehus har kontroll over utviklingen av egne systemer, sier Strümke.

Hvis din bedrift vil kjøpe inn sin egen KI-teknologi, bør du vite at det kommer fra en godartet kilde.



– Man bør ha en sunn skepsis til alle typer KI. Spesielt nå som dette er veldig nytt for mange, sier Silde.

Goodwin mener utviklingen også presser fram et enda større behov for rask regulering av kunstig intelligens.

– Vi må tenke litt ekstra på regulering nå. Dette her er enda en grunn til ikke å stole på veldig mange av KI-ene som er der ute, sier professoren.