Aktuelt · Litteratur · Politik
Kalaallisut oqalussinnaavit?
Det digitale giver nye udfordringer for små sprog som fx grønlandsk.
Siden begyndelsen af 1990’erne har brugere af Microsoft Word været vant til at kunne bruge en dansk ordbog med stavekontrol. Og selv om stavekontrollen fortsat kan være både irriterende og mangelfuld, så er det et redskab som løbende er blevet bedre og bedre. Tilsvarende har vi vænnet os til stavekontrol i emailprogrammer og mange andre digitale redskaber.
Modsat fx grønlandsk (kalaallisut) som først kom med i Microsofts Officepakke i 2016, og som på mange parametre fortsat halter efter den danske udgave.
Det følger næsten som en digital naturlov: desto større sprog, jo bedre fungerer de digitale redskaber. Markedet styrer så at sige.
De små sprog og AI
Med AI-teknologier bliver problemet langt tydeligere. AI er baseret på “big data”. Og “big” er jo netop afgørende. Sprogmodellerne trænes på de store sprog, som gør det vanskeligt at få nuancer og særpræg med på små sprog som dansk. Især metaforer giver vanskeligheder (hvordan skal AI kunne forstå et ord som en “bænkevarmer”?). Og når små sprog som dansk har vanskeligheder, hvordan må det så ikke blive for mindre sprog som fx grønlandsk?
Det er også vanskeligere at kvalitetssikre sprogdata, når mængden er begrænset. Foruden at alle sprogmodeller har både kulturel og sproglig bias, og dette kan være vanskeligere at håndtere, når sproget er lille.
Et element i Danmarks Nationale strategi for kunstig intelligens er at “etablere en fælles dansk sprogressource, der skal understøtte og accelerere udviklingen af sprogteknologiske løsninger på dansk.” Et godt skridt på vejen, hvor man dog kan være i tvivl, om der er afsat tilstrækkeligt med penge.
Men hvordan skal man håndtere dette i resten af Rigsfællesskabet?
Den nordiske vej
Grønlandsk og færøsk er ikke ene om risikoen for at havne bagerst i køen, når tech-giganterne giver os nye redskaber. Blandt andre nordiske sprog med samme udfordring finder man ålandssvensk, samisk, romani, kvænsk og meänkieli. Hertil kommer de nordiske tegnsprog.
Nordisk Råd har vedtaget en sprogkonvention, der blandt andet understøtter sprogteknologi som et redskab til at styrke parallelt sproglighed og flersprogethed i regionen. Sprogteknologi ses som en vigtig komponent i at bevare og styrke de nordiske sprog i en digital tidsalder.
En arbejdsgruppe under Nordisk Råd har peget på tre initiativer, som skal styrke de mindste nordiske sprog:
1) Nordisk indsats for at øge kendskabet til sprogteknologiens betydning.
2) Koordineret nordisk indsats for at inkludere de små sprog i EU’s arbejde med sproglig ligestilling i Europa i 2023.
3) Fælles nordisk dialog og strategi for at få tech-giganterne til at inkludere de små sprog.
Arbejdsgruppen for sprogteknologi i Norden (ASTIN) fokuserer blandt andet på at udvikle applikationer, som understøtter nordiske sprog, også for grupper med særlige behov og for at styrke kvaliteten af sprogteknologi i Norden.
Blandt de sprogteknologiske værktøjer der arbejdes med, er tastaturer, korrekturværktøjer, lokaliseringstjenester og taletjenester. Det handler også om at bygge sprogbanker op for disse sprog – og samtidig om at sikre terminologiudvikling. Der mangler grønlandske fagudtryk på mange områder.
(Da du nåede så langt, skal du også vide, at overskriften betyder ”Taler du grønlandsk?”).