Kritiski mazu resursu valodas pieejamības uzlabošana: MI balstītas pieejas lībiešu valodas datu sintēzei un iegūšanai

Projekta nosaukums: Kritiski mazu resursu valodas pieejamības uzlabošana: MI balstītas pieejas lībiešu valodas datu sintēzei un iegūšanai
Projekta granta līguma numurs: LU-BA-PA-2024/1-0056
Projekta vadītājs (zinātniskais): Valts Ernštreits
Projekta īstenošanas termiņš: 01.09.2024.-28.02.2026.
Projekta kopējais finansējums: 200 000 EUR
Projekta mērķis: šī projekta mērķis ir izveidot lībiešu valodas runas sintezatoru un izmantot to datu multiplicēšanai, lai izpētītu iespējas runas atpazīšanas rīkus attīstīšanai valodām ar kritiski zemiem resursiem, tādējādi sniedzot ieguldījumu digitālās plaisas mazināšanā un pasaules lingvistiskās daudzveidības saglabāšanā. Projekta rezultātā izveidotais lībiešu valodas runas sintēzes rīks ļaus ikvienam valodas apguves un uzturēšanas procesā iesaistītajam un interesentam piekļūt lībiešu rakstītajiem avotiem audio formātā, dos iespēju ģenerēt audio saturu un paplašināt lībiešu valodas lietojuma jomas, veicinot tās attīstību un noturību. Projekta gaitā tiks veicināta zināšanu konsoldiācija Latvijas Universitātes iekšienē, paplašinot sadarbību starp tās pētniecības organizācijām – LU Lībiešu institūtu un LU Matemātikas un informātikas zinātņu insititūtu. Tas veicinās gan institūtu starptautisko sadarbību un konkurētspēju, gan paaugtsinās Latvijas Universitātes kā digitālo humanitāro zinātņu un tehnoloģiju pētniecības centra atpazīstamību.
Projekta rezultāti: iesniegta publikācija – 2, konferenču materiāli – 3, zinātniskās datubāzes un datu kopas – 1, iesniegts projekta pieteikums – 1, citi pētniecības specifikai atbilstoši projekta rezultāti – lībiešu valodas runas sintezators

PROJEKTA GAITAS ATSKAITE

Pārskata periods: 2024. gada 1. septembris – 2024. gada 31. decembris

Sasniegtie rezultāti pastāvīgi atjauninātā formā pieejami projekta vietnē latviski un angliski. 
 

PUBLICĒTIE ZINĀTNISKIE RAKSTI
Tuisk, Tuuli, Nikolai Pharao. Unveiling Tonal Contrasts in The Baltic Region: Exploring Stod in Livonian Spontaneous Speech. Linguistica Uralica LX 2024 4. pp 241—270. DOI: https://doi.org/10.3176/lu.2024.4.01. 
Ernštreits, Valts. Towards the speech recognition for Livonian. 9th International Workshop on Computational Linguistics for Uralic Languages, IWCLUL 2024, November 28-29, 2024 : Proceedings of the Workshop Helsinki : Association for Computational Linguistics, 2024. P.76-80. 
Zinātniskās konferences un semināri, tēžu krājumi
Ernštreits, Valts. Towards the speech recognition for Livonian. 9th International Workshop on Computational Linguistics for Uralic Languages, IWCLUL 2024, November 28-29, 2024.
Ernštreits, Valts. Endangered Languages and Cultures in the Digital Era. Plenārreferāts studentu konferencē “Bridges in the Baltics”. Vilnius, 4.10.2024. 
 

PUBLICITĀTE
LU Lībiešu institūta Facebook lapā publicēti 9 ieraksti par norisēm projektā. Raksti atrodami, meklējot pēc tēmturiem #NextGenerationEU #AtveselosanasFonds
Ernštreits Valts. Stāstījums par LU lībiešu institūta īstenotajiem projektiem. Ventspils lībiešu kultūras dienas, 13.10.2024.
Ernštreits, Valts. Latvijas Radio 1 raidījumā “Zināmais nezināmajā” stāstījums par lībiešu valodu, apdraudēto valodu izaicinājumiem digitālajā laikmetā un pieejām digitālās nevienlīdzības mazināšanā. Raidījums klausāms šeit.
LU Lībiešu institūta dalība Eiropas Zinātnieku naktī. Informēšana par projektiem, digitālajiem instrumentiem un rīkiem. 27.09.2024. 
Ernštreits, Valts. Dalība Radio SWH raidījumā “Prāts izglābs pasauli”, saruna par digitālās pasaules izaicinājumiem un risinājumiem. 21.09.2024. 
 

IETEKME UZ POLITIKAS VEIDOŠANU
Projekta zinātniskās grupas pārstāvji sāk darbu (13.09.2024.) ANO Pirmiedzīvotāju valodu desmitgades Globālās koordinācijas grupas (UNESCO paspārnē) izveidotajās Ad-Hoc grupās. Valts Ernštreits sāk darbu un ir ievēlēts par vienu no diviem līdzpriekšsēdētājiem grupā, kas veltīta pirmiedzīvotāju valodu digitālās vienlīdzības un digitālo lietojuma jomu jautājumiem. Pēc Valta Ernštreita ierosinājuma Ad-Hoc grupa pirmiedzīvotāju valodu digitālās vienlīdzības un digitālo lietojuma jomu jautājumos sagatavojusi savus ieteikumus veidojamajām Neirotehnoloģiju ētikas rekomendācijām (Recommendation on the Ethics of Neurotechnology) saistībā ar pirmiedzīvotāju valodām. Ad-Hoc grupa šobrīd veido plaša mēroga starptautisku aptauju, lai noskaidrotu globālo situāciju saistībā ar pirmiedzīvotāju valodu klātbūtni digitālajā pasaulē un tehnoloģijās.