AI OCH AUTOMATISERING

Gamla dialekter guld värda för AI

Dialektinspelning i Jämtland 1948. Då trodde ingen att inspelningarna skulle bli viktiga för framtidens teknik. Bild: Uppsala universitet

Hur kan några halländska gubbar göra AI-tekniken bättre?

När amerikanska tal till text-modeller ska lära sig svenska har gamla dialektinspelningar visat sig vara en guldgruva.

På Institutet för språk och folkminnen (Isof) har man jobbat mycket med dialektuppsamling, framför allt åren 1935 till 1970 åkte forskare runt i landet och spelade in hur folk pratade.

– Syftet från början var i mångt och mycket att bevara de traditionella dialekterna, berättar Annette C Torensjö, chef för Avdelningen för arkiv och forskning i Uppsala vid Isof.

Inspelningarna användes i många år huvudsakligen av forskare, men förra året tog KB-Labb vid Kungliga biblioteket kontakt. Leonora Vesterbacka är senior data scientist och leder ett projekt med att träna tal till text-modeller, som "översätter" tal till skriven text.

Liten del svenska

Amerikanska AI-modeller är ofta tränade på så kallad massiv flerspråkighet och då blir den svenska delen väldigt liten.

– Det finns en modell från Open AI som heter Whisper och den är tränad på 680 000 timmar på massa olika språk, varav runt 2 000 timmar svenska. Det är 0,3 procent svenska, berättar Leonora Vesterbacka.

Modellerna fungerar bra på rikssvenska, men sämre på dialekter. Det är här de halländska gubbarna, och andra som fått sina dialekter inspelade, kommer in.

– Hade någon sagt till mig på 1980-talet att det nya guldet kommer att vara en gammal konstig rulle med inspelningar i ett arkiv hade jag trott att de skämtade.

Man använder sig också av protokoll och inspelningar från Riksdagsförvaltningen.

– De ansvarar ju för att spela in det som sägs i riksdagen och sedan tillgängliggöra det och släppa protokoll. Det har skett jättelänge.

– I Sverige är vi så duktiga på att bevara allting. Det är häftigt att se att det går att använda i framtiden också.

Göra tillgängligt

När modellerna är färdigtränade kan de till exempel användas för att transkribera läkarjournaler och möten eller skriva undertext till tv-sändningar. De kan också användas för att göra talat material, som poddar och tv-sändningar från myndigheter, tillgängligt.

På Isof hade man inte trott att deras gamla dialektinspelningar skulle bli ett viktigt steg in i framtiden.

– Jag är väldigt nöjd med att våra dialektinspelningar verkligen har så stor relevans nu, att det här är någonting som man faktiskt kan jobba med som en del av samhällsutvecklingen, säger Annette C Torensjö.

Fakta

En dialekt är en språkvariant som talas av invånarna inom ett avgränsat geografiskt område. Den skiljer sig från standardspråket liksom från angränsande dialekter. Skillnaderna kan gälla språkdrag på alla nivåer: fonologisk, morfologisk, lexikal och syntaktisk nivå.

Sociolekt, eller social dialekt, är en språkart som är utmärkande för en viss social grupp. Sociolekter är ofta till uttal, ordböjning och ordförråd också regionalt begränsade så att medlemmar av samma sociala klass i olika delar av ett språkområde varierar inbördes.

Källa: ne.se