Tuvojoties Latvijas Republikas Neatkarības atjaunošanas dienai, valsts iedzīvotāji ir aicināti piedalīties iniciatīvā “Balsu talka”. Veltot vien dažas minūtes sava laika, ikvienam ir iespēja dot vērtīgu ieguldījumu, lai modernās tehnoloģijas, piemēram, virtuālie asistenti (“Siri”, “Google Assistant”), un mākslīgais intelekts pēc iespējas drīzāk kvalitatīvi apgūtu latviešu valodu.

Lai piedalītos šajā sociāli un tehnoloģiski nozīmīgajā projektā, interesentiem ir jādodas uz tīmekļa vietni balsutalka.lv, jāizvēlas teikums un tas jāierunā. Ierunāšanai tiek piedāvāti dažādi teksti, taču par godu 4. maijam dalībniekiem būs iespēja pa teikumam ierunāt arī labi pazīstamo Annas Brigaderes pasaku lugu “Sprīdītis”.

“Balsu talkas” mērķis ir apkopot daudzveidīgus latviešu valodas runas paraugus un to transkripcijas, izveidojot atvērtu un brīvi pieejamu latviešu valodas runas datu kopu vismaz 1000 stundu apjomā. Savukārt maija brīvdienās projekta īstenotāji cer, ka izdosies iegūt ne mazāk kā desmito daļu no nepieciešamā minimālā apjoma.

“Lielākā daļa latviešu valodas runas datu, ko pašlaik izmanto valodu tehnoloģiju uzņēmumi, nav brīvi pieejami. Tas kavē īstenot plašākus pētījumus un inovācijas. Lai iegūtu pēc iespējas vairāk un daudzveidīgākus runas datus, mums ir nepieciešama visas sabiedrības iesaiste. Ja jums ir mirklis brīva laika – nāciet uz balsutalka.lv un saglabājiet savu balsi latviešu valodas nākotnei,“ aicina LU Matemātikas un informātikas institūta vadošā pētniece Ilze Auziņa. 

Sociālā iniciatīva “Balsu talka” turpināsies visu 2023. gadu. Tās mērķis ir iegūt dažādas balsis, tostarp ar izlokšņu iezīmēm un akcentiem. Dalībnieku vecumam, dzimumam un tautībai nav nozīmes – jo daudzveidīgāki balsu paraugi latviešu valodā, jo vērtīgāk.  Līdztekus tam šī ir arī kultūrvēsturiski nozīmīga iniciatīva, jo Latvijā un diasporā ierunātie balsu paraugi tiks saglabāti un nodoti nākamajām paaudzēm. 

“Pēdējo gadu laikā ir notikusi ļoti strauja virtuālo runas tehnoloģiju attīstība, taču Latvijā cilvēki mākslīgā intelekta sniegtās iespējas, piemēram, “Google” asistentu, var izmantot tikai angļu valodā. Mēs visi kopā varam situāciju mainīt! Jo vairāk runas datu kopu būs brīvi pieejamas, jo ātrāk mūsu datori un citas viedierīces “iemācīsies” latviešu valodu un tādējādi spēs vēl vairāk atvieglot mūsu ikdienu,” uzsver Latvijas atvērto tehnoloģiju asociācijas vadītājs Pēteris Jurčenko.

“Balsu talkā” paraugu vākšanai tiek izmantota starptautiski plaši pazīstamā platforma “Mozilla Common Voice”, kur balsu ieraksti tiek vākti daudzās valodās. Latviešu valodā pašlaik ierunātas ir tikai 19 stundas. Salīdzinoši igauņu valodā tās ir 55 stundas, bet lietuviešu – 26 stundas.

 

Par sociālo iniciatīvu “Balsu talka”

“Balsu talka” tiek īstenota Atveseļošanas un noturības mehānisma plāna projektā “Valodu tehnoloģiju iniciatīva”, sadarbojoties LU Matemātikas un informātikas institūtam, LU Literatūras, folkloras un mākslas institūtam, Latvijas atvērto tehnoloģiju asociācijai un UNESCO Latvijas Nacionālajai komisijai.

Dalīties