Latviešu–latgaliešu–lībiešu vārdu sastatījums
Rīkā pieejamas 5000 biežākās leksēmas no latviešu valodas biežuma saraksta (Grasmanis et al. 2025), kas
sastatītas ar lībiešu valodas pamatleksikonu (Ernštreits 2024) un norādītas arī latgaliešu rakstu valodā.
Datus var pārlūkot un analizēt pēc dažādiem parametriem, piemēram, meklēt pēc vārdšķirām (sk. korpuss.lv
latviešu valodas morfoloģisko pazīmju kopu (PDF)) vai konkrētas valodas, meklēt leksēmas un to atbilsmes citās valodās.
Dati: LU MII, RTU Rēzekne un LU HZF Lībiešu valodas institūts
Rīka izstrāde: LU MII
Rīka izstrāde: LU MII
Atsauces
- Grasmanis, Mikus, Valkovska, Baiba, and Levāne-Petrova, Kristīne. 2025. Latvian word frequency dataset, CLARIN-LV digital library at IMCS, University of Latvia. http://hdl.handle.net/20.500.12574/148
- Ernštreits, Valts. A Balanced Vocabulary Without a Balanced Corpus: The Livonian Case. Baltic Journal of Modern Computing. Vol. 12/4, 493–500. https://doi.org/10.22364/bjmc.2024.12.4.11
Finansējums
- VPP "Digitālās humanitārās zinātnes" projekts "Atvērtas un FAIR principiem atbilstīgas digitālo humanitāro zinātņu ekosistēmas attīstība Latvijā" (DHELI; VPP-IZM-DH-2022/1-0002; 2022–2025)
- ES Atveseļošanas un noturības mehānisma plāna projekts “Valodu tehnoloģiju iniciatīva” (2.3.1.1.i0/1/22/I/CFLA/002; 2023–2026)