2.
Podatkovna baza WeSoSlaV kot izhodišče za preučevanje slovenskih glagolov : predavanje na Mednarodnem dnevu slovarjev 2023, Slovarji na obronkih našega prostora, časa in družbe, 16. 10. 2023Petra Mišmaš,
Franc Marušič,
Rok Žaucer, 2023, unpublished conference contribution
Abstract: Pomen besedilnih korpusov za slovaropisje in jezikovne raziskave je v zadnjem času postal zelo očiten. Hkrati pa se zasledi tudi mnenje, da so potrebe po korpusih zadoščene s čim večjim splošnim korpusom tipa Gigafida 2.0 in s še kakšnim specializiranim korpusom spletnih besedil (npr. slWaC, JANES), besedil določenega zgodovinskega obdobja (npr. Korpus 16), govorjenih besedil (npr. GoS), šolskih besedil (npr. Šolar) ipd. V prispevku bomo predstavili primer podatkovne baze, ki je nastala zaradi specifičnih raziskovalnih potreb, ki jih omenjeni korpusi ne morejo zadostiti.
V bazi glagolov zahodnih južnoslovanskih jezikov WeSoSlaV (Western South Slavic Verbs) sta združeni podatkovna baza slovenskih glagolov in podatkovna baza, ki združuje glagole iz bosanščine, črnogorščine, hrvaščine in srbščine (BČHS). Za vsak navedeni jezik je v bazo vključenih po tri tisoč glagolov, pri čemer končno število glagolov za BČHS zaradi podvajanja glagolov med različicami BČHS ni 12.000 temveč 5.300. Do septembra 2023 sta v spletnem repozitoriju Slovenske raziskovalne infrastrukture za jezikovne vire in tehnologije CLARIN.SI objavljena dva dela baze WeSoSlaV, in sicer Database of the Western South Slavic Verb HyperVerb 1.0 (Marušič idr. 2022), ki je namenjen oblikoslovnim lastnostim glagolov, ter Database of the Western South Slavic Verb HyperVerb - Derivation (Milosavljević idr. 2023), v kateri so opisane besedotvorne lastnosti glagolov.
V prispevku se omejujemo na slovenski del baze WeSoSlaV. Predstavljen bo postopek anotacije lastnosti glagolov (lastnosti, kot so naglas, tematski vokali, predpone itd.), težave, ki so se pojavljale pri označevanju (npr. test za nedovršnost), in primer uporabe podatkov, zbranih v bazi.
Keywords: glagol, južnoslovanski jeziki, slovenščina, pripone, predpone, korpus
Published in RUNG: 16.10.2023; Views: 1585; Downloads: 7
Link to file
This document has many files! More...