NorGPT, en norsk “ChatGPT”, ble lansert under Arendalsuka i midten av august. Den norske språkmodellen skal være basert på norske data, og er tilpasset en norsk virkelighet. Ifølge Jon Atle Gulla, utvikleren av chatboten, er det utfordringer med både regnekraft og treningsdata for å komme i mål. Han er likevel optimistisk.
Tilpasset en norsk virkelighet
Det var knyttet stor spenning til verdenspremieren av den nye versjonen av ChatGPT under Arendalsuken for et par uker siden. NorGPT er under utvikling ved NTNU ved forskningssenteret NorwAI, i samarbeid med DNB og Schibsted.
Chatboten er, i likhet med sin mer kjente navnebror, et avansert system drevet av kunstig intelligens som generer tekst på henvendelser fra brukere. Dette er også bare kalt for en språkmodell.
NorGPT vil derfor gjette ord i en setning den presenteres for. Ofte er flere alternative svar mulige, og både sannsynligheter i språkmodellen og andre teknikker brukes til å vurdere i hvilken grad svaret er godt eller riktig.
Det som derimot skiller NorGPT fra ChatGPT, er at førstnevnte basert på norske data, og således tilpasset norsk virkelighet. NorGPT vil videre komme i flere versjoner, der den største har 23 milliarder parametere.
Men der ChatGPT har vært gjennom en såkalt “alignment”-fase, har NorGPT ikke vært det. Av den grunn har ikke den norske språkmodellen lært hva som passer seg og ikke.
ChatGPT Norsk Eier ikke folkeskikk
Modellen som ble presentert under Arendalsuken eier rett og slett ikke folkeskikk, forklarer NorGPT-utvikler Jon Atle Gulla til Universitetsavisa.
– NorGPT har ikke gjennomgått alignment-fasen hvor den lærer seg alminnelig folkeskikk. Dermed vil vi få en del giftig språk, fordommer, tabuord og mer til, sier han.
Gulla blir videre spurt om modellen kan banne og det som verre er, hvor han svarer kontant “ja”. Han legger deretter til at “den kan legge i vei om prositusjon i Trondheim og annet”, og begrunner det med at det er sånn det er når den ikke har fått filtreringskomponenten som skal på toppen av systemet.
Gulla forklarer at den presenterte modellen er på et mellomstadium, og at han sammen med sitt team skal jobbe med formingsprosessen utover høsten. Målet er å utvide modellen til å omfatte dobbelt antall parametere som dagens modell.
NorGPT vil da i så fall ha 46 millioner parametere. Til sammenligning har ChatGPT 175 milliarder parametere. Det er nettopp antallet parametre som sier noe om språkmodellenes evne til å gjenkjenne komplekse mønstre og relasjoner i data. Med andre ord sier det noe om chatbotenes evne til å respondere på henvendelser.
Skrikende behov for en norsk språkmodell
Språkmodeller, som ChatGPT, er ifølge Tore Oksholen, ansvarlig redaktør i universitetsavisa, i ferd med å bli en ny plattform for tjenester. Han mener det også er selve motoren i skapende kunstig intelligens.
Akkurat derfor mener han det er viktig med en norsk språkmodell. Oksholen drar det faktisk så langt at han mener “det står om norsk språks overlevelse”. Tore Oksholen er heller ikke den eneste som mener det er et stort behov for en norsk språkmodell.
Mari Sundli Tveit, direktør i Forskningsrådet, sier at hun tror det er helt nødvendig å utvikle en modell med norsk språk. Dette for å kunne bedre treffe på norske problemstillinger. Tveit har også vært dypt engasjert i den raske utviklingen av kunstig intelligens, ofte bare kalt AI.
Hun etterlyser derfor mer forskning for å øke kunnskapen rundt teknologien, og da spesielt i henhold til datasikkerhet og personvern. Tveit forklarer til Universitetsavisa at Forskningsrådet vil hjelpe til med å finansiere forskning for å få frem kunnskapsgrunnlaget.
Dukker stadig opp nye norske chatbots
Etter ChatGPTs inntreden har AI og chatbots virkelig blitt et hett tema. Teknologiselskapene har nærmest startet et kappløp om å bli ledende innenfor feltet. Bare i løpet av det siste året har det kommet mange AI-chatbots på markedet. Google og Microsoft er blant selskapene som har satset tyngst på nettopp dette.
Førstnevnte har for eksempel lansert en egen chatbot kalt Bard, mens Microsoft er største eier i OpenAI, selskapet som har utviklet ChatGPT. Også en Apple-chatbot kan være på trappene. Verdens største selskap målt i markedsverdi vurderer etter sigende å lansere en språkmodell kalt “Ajax”. Øvrige chatbots på dagens marked er YouChat, Character.AI og Bing, for å nevne noen.
Kilder
https://the-decoder.com/gpt-4-has-a-trillion-parameters/
https://www.cw.no/ai-arendalsuka-norgpt/ambisios-lansering-av-norsk-chatgpt/2140315