Gå til hovedindhold

Stemmeindsamlingen rammer landsdækkende TV i bedste sendetid

Hvad skal der til for at en sprogmodel kan afkode Aarhusiansk, Randrusiansk og Sønderjysk? Den skal selvfølgelig fodres med dialekter.

  • Læs op

Indhold

    Hvis du sad ved brændeovnen og så nyheder i efterårsferien, så oplevede du måske Bo Fristed i TV2-nyhederne fredag 18. oktober, som midt i den bedste sendetid repræsenterede Open Data DK-projektet Donér Din Stemme. For at det ikke skal være løgn, så var projektet også under behandling samme dag i News & Co kl 16.30, hvor panelet fik lejlighed til at spørge ind til initiativet. 

    I takt med at stemme-baserede chatbots bliver mere udbredte i det offentlige, er der i stigende grad et behov for at sikre at alle borgere kan blive hørt og forstået, og det kræver at sprogmodellerne har tilstrækkeligt med eksempler i deres træningsdata på forskellige måder at tale dansk på, til at de kan forstå dem.

    Open Data DK-projektet Donér din stemme debuterede i August på teknologifestivalen Vilde teknologier. I Donér Din Stemme har borgere mulighed for at donere deres stemmer, ved at læse små tekstbidder højt på deres dagligdags dialekt. Filerne bliver herefter udgivet på Open Data DK som et datasæt der skal bidrage til at træne sprogmodeller, så de bliver bedre til at forstå forskellige varianter af dansk. På den lange bane betyder er der et stort potentiale for forbedringer af tilgængeligheden i det offentlige, hvor borgere med kraftige dialekter eller accenter ellers kan blive udfordrede. 

    Sidst opdateret: 25. oktober 2024