SELMA projekta dalībnieki.

Latvijas Universitātes Matemātikas un informātikas institūts (LU MII) ir sācis līdzdalību Eiropas Savienības pētniecības un inovāciju programmas “Horizon 2020” projekta SELMA īstenošanā. Tā mērķis ir izveidot daudzvalodu atvērtā pirmkoda platformu un izstrādāt jaunas metodes mākslīgā intelekta valodas modeļu iegūšanai, izmantojot dziļo mašīnmācīšanos.

Pasaulē ik dienu tiek radīts milzīgs daudzums teksta un audiovizuāla satura. Valodu tehnoloģiju projekts SELMA palīdzēs žurnālistiem un mediju analītiķiem pētīt un izprast šo apjomīgo satura plūsmu. Vienlaikus tiks veicināta daudzvalodu audiovizuālā satura veidošana un plašāka pieejamība, izmantojot automātisku runas transkribēšanu, mašīntulkošanu, subtitru ģenerēšanu un balss sintēzi.

SELMA konsorcija mērķis ir izveidot multilingvālu atvērtā pirmkoda platformu un izstrādāt jaunas metodes mākslīgā intelekta valodas modeļu iegūšanai, izmantojot dziļo mašīnmācīšanos. Platforma spēs apstrādāt 10 milj. satura vienību dienā, un tās mākslīgā intelekta komponentes tiks regulāri pilnveidotas, sistēmai turpinot pašmācīties. Valodu modelēšanā un apstrādē tiks izmantota jauna pieeja, kas ļaus saglabāt katrai valodai raksturīgās iezīmes – sistēma primāri apkopos un analizēs saturu oriģinālvalodā, nevis izmantos angļu valodu kā starpniekvalodu. Tulkošana un runas sintēze citās valodās tiks veikta pēc pieprasījuma.

Projekta konsorciju koordinē starptautiskās raidorganizācijas “Deutsche Welle” (DW) inovāciju nodaļa. Citi partneri ir Aviņonas Universitātes Datorzinātņu laboratorija LIA (Francija), valodu tehnoloģiju uzņēmums “Priberam” (Portugāle), Fraunhofera Intelektuālās analīzes un informācijas sistēmu institūts (Vācija).

LU MII dalība SELMA projektā (Nr. 957017) ir iespējama, pateicoties ilggadējai sadarbībai ar industrijas partneriem, ar kuriem kopīgi realizēti dažādi nacionāla un starptautiska līmeņa pētniecības un inovāciju projekti mākslīgā intelekta un dziļās mašīnmācīšanās jomās. Īpaši nozīmīga ir bijusi LU MII pēdējo gadu sadarbība ar nacionālo informācijas aģentūru LETA un Rīgas Austrumu klīnisko universitātes slimnīcu, īstenojot ERAF praktiskas ievirzes pētījumus “Dziļās mašīnmācīšanās modeļi un to dzīves cikla pārvaldības ietvars multimediju datu apstrādei ziņu aģentūrās” (Nr. 1.1.1.1/18/A/045) un “Latviešu valodas runas atpazīšana un sintēze medicīnas lietojumiem” (Nr. 1.1.1.1/18/A/153).

Dalīties