Språkrobotarna som ger en ny digital framtid

Marcus Alexandersson/TT

Publicerad 2023-01-23

En digital uppstickare håller på att förändra en av internets grundpelare. Samtidigt försöker en svensk idé rida på framgångsvågen. Men är allmänheten redo för ett nytt nät?

– Nu måste vi ställa om, säger en expert på området.

Minns du Altavista? I internets barndom blev söktjänsten omsprungen av Google som verktyget alla använde för att ta reda på saker. Nu mumlas det från olika hörn av nätet att det kan vara Googles tur att bli förbipasserad. Nykomlingen heter Chat GPT och representerar något som Google riskerar att försvinna från: framtiden.

Chat GPT, utvecklat av Elon Musk-grundade Open AI, är en så kallad textrobot. Den kan generera text på ett hittills icke uppnått sätt både vad gäller innehåll och användarvänlighet. Tekniken är varken superny eller felfri, och de bakomliggande algoritmerna fortsatt okända, men resultatet är en tjänst som, något förenklat, kan ge information samtidigt som den för ett samtal med dig. Du behöver alltså inte formulera din fråga lika precist som Google i dagsläget kräver. Det räcker med ”fiskrecept till middag” och du får igång en dialog med tjänsten.

– Den här typen av språkmodeller kommer att bli viktiga för samhället. För oss datavetare handlar det om att vara snabbfotade, att vara beredd på att omvärdera allt hela tiden, säger Daniel Gillblad som ansvarar för forskning och strategi på AI Sweden, Sveriges nationella center för artificiell intelligens.

Konversation med data

Det svenska initiativet heter GPT SW3 och verkar lite i utkanten av de stora futuristiska penseldragen men bygger på liknande teknik som gjort Chat GPT till techvärldens senaste fenomen. GPT SW3 kan möjligen komma att revolutionera såväl skolväsendet som den offentliga vardagen i Sverige.

– Vi vill skapa en basmodell som är så generell som möjligt och som fungerar för så många domäner i ett svenskt sammanhang som möjligt, säger Francisca Hoyer, strategisk programledare för språkteknologi på AI Sweden.

Såväl Chat GPT som GPT SW3 bygger vidare på en gammal sanning inom internet och tech: allt handlar om data. Data som i information. Har du information har du makt. Har du dessutom en begriplig produkt har du en guldgruva.

”Konversationen” i Chat GPT bygger på att roboten, eller mer precist AI-språkmodellen, vet hur ”samtalet” mest troligt kommer fortsätta – baserat på den textdata den använder som bränsle. Det är helt enkelt troligare att du frågar om priset på lax och var du kan köpa den efter att ha ställt middagsfrågan än vad det är att du frågar om vad dvärgen i ”Sagan om ringen” heter (Gimli).

– Chat GPT tänker inte själv. Vad är det den spottar ur sig? Det är statistik, statistik fördelning av text, säger Francisca Hoyer.

Svensk inställning

”Robotkonkurrenter” till Chat GPT existerar redan i olika form, alltifrån Apples Siri till Googles egna chattrobot. Det som är unikt för Open AI:s lösning är att den klarar av att sammanfatta exempelvis forskningsrapporter samtidigt som den kan komponera en dikt om två elefanter som dansar rumba. Allt med hjälp av den massiva mängd data, text, som den tränats på. Och den gör det på ett sätt som är lättillgängligt för genomsnittsanvändaren.

GPT SW3 är inte lika kommersiell. I stället är tanken att utveckla en svensk grundplåt varifrån aktörer kan skapa egna lösningar. Oavsett om det blir en chattrobot i vården, ett verktyg som kategoriserar mejl eller något som automatiskt skriver produktbeskrivningar, sportnotiser eller sammanfattning av hemtentan.

– Jag är jättenyfiken på vad forskare och samarbetspartners kommer vilja göra med modellen, säger Francisca Hoyer.

Just att bjuda in till samarbete kring att utveckla GPT SW3 får modellen att skilja sig från Chat GPT.

– Open AI erbjuder just nu väldigt fina gränssnitt som är gratis. Men det är inte så att folk kan gå in i själva parametrarna i modellen och ändra och förstå. Det kan vi göra här. Vi erbjuder hela modellen. Möjligheterna för vidare utveckling och forskning är på en annan skala när vi gör så här, säger Daniel Gillblad.

Urvalsprocess

Att bygga en språkmodell på svenska skiljer sig från att göra det på engelska även på det mest grundläggande planet, tillgången till data är mer begränsad.

– Chat GPT klarar av svenska, men vi vet inte varifrån datan kommer. Om det är Google-sökningar eller Wikipedia eller något annat. Vi jobbar på ett annat sätt, transparent, säger Francisca Hoyer.

Ett medvetet val från AI Swedens sida är att inte enbart ha ”högkvalitativa textkällor” när det kommer till att mata modellen med data.

– En modell enbart tränad på myndighetssvenska skulle inte vara en bra chattrobot exempelvis. Det är viktigt att det inte bara är finsvenska, utan också med lite stavfel och liknande.

Bland datakällorna för GPT SW3 återfinns forumen Flashback, Familjeliv och delar av Reddit. Att innehållet där kan vara både rasistiskt och sexistiskt oroar inte.

– Vi är fullt medvetna om problematiken. Det visar hur viktigt det är att ha koll på träningsdatan. Det gäller alla datakällor, säger Francisca Hoyer.

Daniel Gillblad fyller i:

– En viss typ av partiskhet kan spela roll i modeller som förutser genetiska sjukdomar exempelvis, men är inte relevant om vi pratar om arbetsintervjuer. Om modellen ska vara grunden för väldigt många tillämpningar kan man inte plocka bort saker från början.