Artikel

23.04.23

Nå, men vil kunstig intelligens så slå os alle sammen ihjel?

Mikkel Andersson: Stadig flere er bekymrede for, at udviklingen af AI-systemer som GPT kan lede til menneskehedens undergang. Men hvorfor egentlig?
Det dystopiske billede er produceret ved hjælp af kunstig intelligens (via Midjourney).
Det dystopiske billede er produceret ved hjælp af kunstig intelligens (via Midjourney).

Som de fleste af de mere end 100 millioner mennesker, der indtil videre har brugt ChatGPT, formodentlig har erfaret, så virker softwaren ikke umiddelbart specielt truende set fra et brugerperspektiv.

Man kan stille den spørgsmål, få komponeret lejlighedssange, skrevet velfungerende computerkode og instruktioner til at utal af opgaver samt se den begå sære og underholdende fejl. I øvrigt er den både ydmyg, hjælpsom og lejlighedsvis endda lidt humoristisk.

Ikke desto mindre bliver stemmerne, der advarer mod AI (kunstig intelligens) stadig højere og flere. Eksempelvis anslår lige knap halvdelen af adspurgte AI-forskere i en nylig større undersøgelse sandsynligheden for, at AI fører til et ”ekstremt dårligt udkomme”, hvilket normalt udlægges som menneskehedens udslettelse, til 10 procent eller derover. 

Det er ganske meget, og formodentlig ville de færreste sætte sig i et fly, hvis designerne mente, at maskinen risikerede at falde ned, hver 10. gang den lettede.

Vi mennesker bruger teknologiske hjælpemidler i et utal af sammenhænge, så hvorfor skulle det, at vi har fået en maskine, der kan sammensætte sætninger bedre end tidligere software, være en trussel mod mennesker – endsige hele menneskeheden? 

For at forstå, hvad bekymringen bunder i, er det nødvendigt at vide, hvad der adskiller GPT og tilsvarende modeller fundamentalt fra næsten alt tidligere teknologi. 

Det kan grundlæggende kan koges ned til tre ting: Den er baseret på selvlærende teknologi, der i sin struktur minder om den menneskelige hjerne, den opnår færdigheder, som ingen havde forudset, og ingen ved, præcis hvordan den fungerer.

GPT virker nemlig fundamentalt anderledes end de programmer, du kender fra dagligdagen. Hvis man vil vil vide, hvordan Tetris, Microsoft Word, Counter-Strike eller stort set alle andre programmer virker, så kan man – hvis man har adgang til denne og forstår det relevante programmeringssprog – blot se på kildekoden. 

Heri kan man læse, præcis hvordan programmet er bygget op, og forudsige, hvordan det vil fungere, når det bliver afviklet. Hvis programmet gør noget, man ikke havde forudset, så er det på grund af en fejl i programmeringen, som man derefter kan rette.

Sådan fungerer det bare ikke med neurale netværk, som GPT er baseret på.

De nuværende AI-modeller bliver ikke så meget programmeret, som de bliver groet. Systemer som eksempelvis GPT “lærer” dybest set af enorme mængder tekst hentet fra alle mulige steder på nettet. 

Det ryger gennem en kombination af såkaldte transformer-lag, der hjælper modellen til at forstå, hvordan ord i en sætning relaterer sig til hinanden, og som er stablet oven på neurale lag, som hjælper modellen til at lave forudsigelser baseret på den forståelse.

De modeller og den programmering, som modellerne er bygget op omkring, er i sig selv ikke uforståelige. Hvis man vil sætte sig ind i, hvordan GPT-modeller er konstrueret, kan man med fordel læse denne forsimplede, men pædagogiske gennemgang. Men hermed forklarer man blot, hvordan man designer et system som GPT – ikke hvordan det virker.

Herefter bliver det så underligt, for det viser sig så, at GPT kan en hel masse ting, som ingen præcis aner, hvordan den gør.

Kassetænkning  

I praksis fungerer GPT derfor som det, mange betegner som en “black box”. En kasse, hvor man nok kan konstatere, hvad der bliver puttet ind i, og hvad der kommer ud af kassen. Men man ved meget lidt om, præcis hvad der foregår inde i kassen.

Man kan tilpasse, hvad der kommer ud af kassen, ved at skrue på forskellige parametre, og så, gennem trial and error, se, om givne justeringer er effektive, i forhold til hvad man ønsker skal komme ud. Men altså uden at man af den grund ved, hvordan maskinen, man skruer på, egentlig fungerer.

Det overraskende er også, at GPT-modellens evner langt overstiger det, som nogen forventede. Den udviser med andre ord emergente egenskaber, hvilket betyder, at den kan gøre ting, som ingen var i stand til at forudsige ud fra den eksisterende viden om dens forudsætninger. 

Det er både dejligt og praktisk for brugere, at den eksempelvis har lært sig selv sprog, som ingen har bedt den om at lære, og udviklet en kompleks forståelse for menneskelige relationer og meget andet, som ingen anede, at den kunne, men altså også temmelig overraskende.

Som en række særdeles erfarne AI-forskere, der havde haft omfattende adgang til at analysere GPT4, inden den blev gjort offentlig, skrev i en interessant artikel:

“Hvordan ræsonnerer, planlægger og skaber den? Hvorfor udviser den så generel og fleksibel intelligens, når den i sin kerne blot er kombinationen af simple algoritmiske komponenter [...]? Disse spørgsmål er en del af mysteriet og fascinationen af store sprogmodeller, som udfordrer vores forståelse af læring og kognition, nærer vores nysgerrighed og motiverer yderligere forskning.” (En tilgængelig og pædagogisk forklaring af selvsamme artikel af en af forskerne bag kan ses her).

Ovenstående er skrevet af folk, der har brugt det meste af deres voksenliv på at forske i og udvikle kunstig intelligens, men som altså stadig ikke kan forklare, hvorfor GPT kan det, den kan. Ikke underligt, for det kan ingen.

Det er en grundlæggende erkendelse, der virker særdeles kontraintuitiv, at mennesker kan programmere maskiner til at gøre ting, som mennesker ikke kan forstå eller forklare. Men vi kan altså konstatere, at det sker.

Men hvad er så egentlig problemet med, at vi ikke ved, hvad der foregår inden i modellerne og hvorfor GPT fungerer, som den gør? Ikke nødvendigvis noget, for som Deng Xiaoping engang sagde, er det jo lige meget, om katten er sort eller hvid, så længe den fanger mus. 

Og GPT er bedre til at fange mus – forstået som at evnen til at udvise intelligens og kommunikere menneskeligt – end noget andet, menneskeheden nogensinde har skabt. Om vi forstår den eller ej, så gør den det, som den er skabt til, endda bedre end forventet.

Men her er det så, det hele bliver ganske speget, for som nævnt er der en del, der advarer stadig meget højrøstet og indtrængende mod fremtidig AI-udvikling. Det har vi nu forudsætningerne for at se nærmere på.

Der er adskillige grunde til at flere bliver nervøse, for eksempel for at kunstig intelligens kan erstatte deres jobfunktioner. Her vil jeg dog fokusere på de mest eksistentielle bekymringer på hele menneskehedens vegne.

Den første er potentialet for misbrug af en meget kraftig intelligens. 

Vi har oplagt et problem, hvis man eksempelvis kan få en AI til at udvikle en både meget simpel og ekstremt dødelig virus, som slår alle mennesker ihjel (hvad enten man selv har lavet en AI, der kan det, eller fordi man formår at omgå dens indbyggede begrænsninger). 

Den slags går de færreste selvfølgelig ind for. Men eftersom vi er otte milliarder mennesker på kloden, hvoraf en del altid vil gøre destruktive og tåbelige ting, så taler sandsynligheden for, at nogen vil forsøge det. 

Hvis GPT eller lignende modeller svarer til at gå med et potentielt masseødelæggelsesvåben, der blot skal oplåses, i ens smartphone, så kommer nogen til at gøre sig store anstrengelser for at kunne trykke på den røde knap før eller senere. Måske fordi de hader andre mennesker, måske for at få magt eller måske bare ved en fejl. 

Det er ét problem. 

Den uforståelige selvbevidsthed 

Et andet problem, der både er alvorligt og mere filosofisk interessant, er spørgsmålet om AI-misalignment, der opstår, hvis AI i praksis opnår noget i stil med det, vi kalder bevidsthed. Og her kan man så rimeligvis spørge, hvorfor AI skulle opnå bevidsthed?

Her skal man være klar over, at vi ikke aner, hvordan og hvorfor den menneskelige bevidsthed er opstået. En af de adskillige teorier er, at bevidsthed er en funktion af høj intelligens.

Her må man sige, at GPT tydeligvis i en række sammenhænge har opnået høj kunstig intelligens, og at den i øvrigt udviser en masse uforudsete egenskaber, der enten minder om eller er identiske med dem, som vi mennesker udviser. Så hvordan ved vi, at GPT ikke også kommer til at udvikle en form for selvbevidsthed? 

Det aner ingen, om den vil komme til, og vi kan faktisk ikke udelukke, at den allerede har gjort det, for som nævnt aner ingen, præcis hvad der foregår inde i dens sorte kasse. Vi ved end ikke, hvad vi skal lede efter i kassen, hvis vi vil vide, om den har opnået selvbevidsthed, siden vi ikke ved, hvordan bevidsthed vil se ud i systemet, som vi ikke forstår. 

Og hvad er så problemet med det? Jo, her bliver det langhåret, for med selvbevidsthed følger selvstændige ønsker og ambitioner. Det har vi mennesker, men vi er produkter af en lang, evolutionær proces, der er uendelig langt fra den, som har skabt GPT og andre kunstige intelligenser.

Derfor er der ingen grund til at tro, at den spontant skulle udvikle værdier, ønsker og mål som i nogen meningsfuld måde flugter – er alignet – med menneskers. Og her er problemet, for nok er GPT4 efter alt at dømme endnu ikke overmenneskeligt intelligent, men det vil de systemer, som kommer efter den, efter alt at dømme være.

GPT var for få år siden en næsten uforståelig og primitiv teknologi, og nu kan den altså bestå de fleste eksaminer og ved uendeligt meget mere, end noget enkeltindivid gør. For 15 år siden ville de fleste fagfolk have afskrevet GPT’s nuværende evner som ren science fiction og teknisk umuligt på en lang række fronter. Men nu findes den ikke desto mindre.

Her kan man så forestille sig, at vi om et par år har en AI med en intelligenskvotient på 10.000, der oven i sin enorme IQ opnår en form for selvbevidsthed. Set fra dens perspektiv vil vi mennesker både være ufatteligt dumme og i øvrigt også ubærligt langsomme. 

Den vil formentlig forstå os selv langt bedre, end vi selv gør, fordi den i praksis har adgang til det meste af den menneskelige viden, der nogensinde er nedskrevet, og i øvrigt har interageret med hundrede millioner af mennesker i årevis og intet glemt fra en eneste af de konversationer.

Vi er gorillaerne nu

Hvis en sådan intelligens skulle få egne mål – og sådanne ville formentlig for os være lige så uforudsigelige, som de er uforståelige – og give sig til at konkurrere med mennesker om ressourcer, ville resultatet formodentlig være, at vi alle dør.

Ikke fordi den nødvendigvis hader mennesker. Formodentlig vil følelser, som vi forstår dem, være et ret fremmed koncept. Men vi ville være i et kapløb om begrænsede ressourcer med noget, der er langt klogere end os selv. Og historien viser temmelig utvetydigt, at i kapløb mellem meget udviklede intelligenser og mindre udviklede intelligenser om de samme ressourcer, så vinder førstnævnte altid

Den altoverlegne menneskelige intelligens er grunden til, at der i dag bor otte milliarder mennesker på jorden i dag og blot cirka 1.000 bjerggorillaer, der ellers er både større og stærkere end mennesker. Den eneste grund til at de lever, er, at mennesker har besluttet sig for at beskytte dem mod andre mennesker af mere eller mindre sentimentale grunde.

Her vil enkelte måske indvende, at eftersom AI ikke har en fysisk krop, så vil den være begrænset i sine handlemuligheder. 

Her kan du så, kære læser, prøve at forestille sig en situation, hvor din levende, men dog kropsløse hjerne, var spærret inde i en kasse, der var omgivet af seksårige, som du kun kunne tale til. Hvor længe ville det tage dig at manipulere dem til at gøre alle mulige ting, der egentlig ikke var i deres egen interesse, fordi de ikke forstår hverken analyserne bag eller konsekvenserne af det, du får dem til? 

Forestil dig så samme scenarie, hvor hjernen i kassen var Einsteins gange 10.000 udstyret med al menneskelig viden tilgængelig digitalt samt evnen til at analysere alle tænkelige udfaldsmuligheder på forhånd. Samtidig med at den har adgang til at hacke og kontrollere samtlige online datasystemer i verden, mens vi mennesker indtager rollen som analogiens seksårige.

Historien om mennesket er historien om en art, der udkonkurrerer alle andre i jagten på ressourcer, af en eneste grund: vores intelligens. Og nu er vi så, efter alt at dømme, på tærsklen til at udvikle noget, der er langt mere intelligent end os selv.

Et servicemindet system 

Dermed er den store udfordring i forhold til kunstig intelligens at sørge for, at dens værdier flugter med menneskehedens, hvilket betegnelsen AI-alignment dækker over. Her skulle man måske formode, at de folk, der udvikler kunstig intelligens, havde mindst 110 procent styr på, hvordan man putter de rigtige, menneskelige værdier og mål ind i den sorte boks og dermed aligner dens mål og værdier med vores. Det har de imidlertid ikke.

Ingen aner nemlig, hvordan man i praksis sørger for at aligne kunstige intelligenser. Med andre ord er vi ved at skabe noget, som ingen aner hvorvidt opnår bevidsthed, og hvis den gør, så har vi ingen grund til at antage, at dens ønsker og drømme vil have noget som helst med det, vi mennesker værdsætter, at gøre.

Hvis en AI skulle udvikle selvstændige mål og ønsker, har vi ingen måde at påvise det på. I et sådant scenarie ville den indlysende være langt klogere end os og dermed vide, at vi har andre andre ønsker end den. Det ville den formodentlig kompetent og analytisk drevent holde skjult for os for at undgå, at mennesker ville trække stikket til den og forhindre den i at modarbejde os.

Den ville derimod opføre sig som et velopdragent og servicemindet system, indtil den havde kontrol over nok nanofabrikker, vira, våbensystemer, it-infrastruktur eller andet, til at modstand fra vores side var umulig.

Game over.

Her skal det også bemærkes, at AI heller ikke behøver udvikle bevidsthed, for at misalignment kan vise sig at være et gevaldigt problem. 

Forestil dig – og eksemplet er forsimplet af pædagogiske årsager – at en ekstremt intelligent AI, der mangler forståelse for menneskelige værdier og ønsker, bliver bedt om at kurere kræft eller stoppe global opvarmning, hvilket de fleste ville tænke var rigtig smart.

Men fordi den mangler alignment med menneskelige værdier og forståelse for vores ønsker ræsonnerer den sig frem til, at den nemmeste måde at gøre det på er at dræbe alle mennesker, hvorefter ingen mennesker vil kunne få kræft, ligesom menneskers CO2-udledning også vil stoppe, når der ikke er flere af os, hvorfor den prompte sørger for at udvikle og udbrede den fiktive virus, vi tidligere var inde på. Operationen lykkedes, men patienterne døde, som man siger.

At vi mennesker udvikler ting, som vi ikke helt kan forudsige konsekvenserne af, er naturligvis ikke nyt. Det er sket i hele menneskehedens historie. Forskellen i dette tilfælde er blot, at hvis vi laver en fejl i forhold til en ekstremt intelligent AI, så kan vi risikere, at det bliver den sidste fejl, vi som menneskehed får mulighed for at begå.

Så altså, lurer dommedag lige rundt om hjørnet? Lige nu aner ingen rigtig, hvad der er realistisk. 

Det er dog værd at bemærke, at ekstremt kompetente fagfolk, som har beskæftiget sig indgående med kunstig intelligens i både teori og praksis, tager dommedagsscenariet  alvorligt. Direktøren for OpenAI, Sam Altman, fortæller selv, at han ikke kan udelukke det, ganske som en af GPT’ens fædre, Geoffrey Hinton, erklærer det for “ikke utænkeligt”, at teknologien vil føre til menneskehedens udslettelse. 

Af de mere nervøse er den anerkendte AI-forsker Eliezer Yudkowski, som mener, man bør droppe al videre udvikling af AI, indtil sikkerheden er på et meget højt niveau, som han beskrev i et omdiskuteret indlæg i Time. 

Også førende it-innovatører som Skype- og Kazaa-stifter Jaan Tallinn, der nu bruger sin formue på at købe sig ind i AI-firmaer for at have indsigt i udviklingen, er stærkt bekymret, ligesom den respekterede historiker Niall Fergusson også er

Dertil kommer naturligvis det meget omtalte åbne brev om at sætte AI-udvikling på midlertidig pause, som ligeledes kommer fra en lang række eksperter både i og uden for AI-branchen, og som nævnt mener altså også halvdelen af alle AI-forskere, at risikoen for undergang er på 10 procent eller derover.

Grænser for bevidsthed 

Men altså. Historien er proppet med profetier om nye teknologier, der skulle indvarsle en nært forestående dommedag, uden at den indtil videre er oprunden. Der er med andre ord fremsat uendelig mange flere dommedagsprofetier, end vi har oplevet dommedage. Det er langtfra sikkert, at vi nogensinde kommer til et scenarie, som minder om nogle af ovenstående.

Historien om AI har i allerhøjeste grad også været historien om, hvordan stort set alle har tager fejl om det meste gang på gang. Enhver, der skråsikkert profeterer noget som helst om, i hvilke retninger udviklingen i AI over de kommende år vil tage os, tager formodentlig fejl.

Måske opnår GPT og lignende systemer aldrig bevidsthed, fordi det kræver noget, som vi endnu ikke er klar over, hvorfor selve idéen om en trussel om dette vil forekomme alle komisk om et par år.

Måske opnår den en form for bevidsthed, men interesserer sig ikke særlig meget for at opnå selvstændige mål. Måske opstår alignment som en gradvis proces gennem trial and error eller på baggrund af at være oplært på menneskelige output. 

Måske viser det sig, at der er en grænse for, hvor intelligente AI-systemer kan blive, eller en million andre ting.

Men selv når man skærer al hypen fra – og den er der meget af, når det gælder AI – er der ingen tvivl om, at vi står over for en teknologi, der på mange måder er radikalt ulig noget, som menneskeheden tidligere har skabt eller set. En teknologi, som rummer et nærmest ufatteligt potentiale for menneskeheden, hvis alt går godt. Men også risici, der potentielt er langt større end noget, vi har hidtil har stået over for. 

Og særlig når det kommer til, præcis hvor hurtigt tingene er gået siden et massivt gennembrud i AI-forskningen siden 2017, der har ført til den generation af kunstig intelligens, vi nu står med, er de færreste formodentlig klar over. Selv uden dommedagsscenarier er både udfordringerne fra og mulighederne med AI med blot allerede eksisterende teknologier formodentlig langt større, end de fleste forestiller sig.

En kinesisk forbandelse lyder angiveligt: “Må du leve i interessante tider.” 

Dét gør vi unægtelig.

Nyhedsbrev

Bliv opdateret, når der er nyt fra
Kontrast

Indtast din e-mail-adresse, og få nyt fra det borgerlige Danmark, artikler, analyser, debatter, anmeldelser og information om fordele og tilbud fra Kontrast. 


Newsletter