Title: | Podatkovna baza WeSoSlaV kot izhodišče za preučevanje slovenskih glagolov : predavanje na Mednarodnem dnevu slovarjev 2023, Slovarji na obronkih našega prostora, časa in družbe, 16. 10. 2023 |
---|
Authors: | ID Mišmaš, Petra (Author) ID Marušič, Franc (Author) ID Žaucer, Rok (Author) |
Files: | https://isjfr.zrc-sazu.si/sl/dogodki/mednarodni-dan-slovarjev-2023
|
---|
Language: | Slovenian |
---|
Work type: | Unknown |
---|
Typology: | 3.15 - Unpublished Conference Contribution |
---|
Organization: | UNG - University of Nova Gorica
|
---|
Abstract: | Pomen besedilnih korpusov za slovaropisje in jezikovne raziskave je v zadnjem času postal zelo očiten. Hkrati pa se zasledi tudi mnenje, da so potrebe po korpusih zadoščene s čim večjim splošnim korpusom tipa Gigafida 2.0 in s še kakšnim specializiranim korpusom spletnih besedil (npr. slWaC, JANES), besedil določenega zgodovinskega obdobja (npr. Korpus 16), govorjenih besedil (npr. GoS), šolskih besedil (npr. Šolar) ipd. V prispevku bomo predstavili primer podatkovne baze, ki je nastala zaradi specifičnih raziskovalnih potreb, ki jih omenjeni korpusi ne morejo zadostiti.
V bazi glagolov zahodnih južnoslovanskih jezikov WeSoSlaV (Western South Slavic Verbs) sta združeni podatkovna baza slovenskih glagolov in podatkovna baza, ki združuje glagole iz bosanščine, črnogorščine, hrvaščine in srbščine (BČHS). Za vsak navedeni jezik je v bazo vključenih po tri tisoč glagolov, pri čemer končno število glagolov za BČHS zaradi podvajanja glagolov med različicami BČHS ni 12.000 temveč 5.300. Do septembra 2023 sta v spletnem repozitoriju Slovenske raziskovalne infrastrukture za jezikovne vire in tehnologije CLARIN.SI objavljena dva dela baze WeSoSlaV, in sicer Database of the Western South Slavic Verb HyperVerb 1.0 (Marušič idr. 2022), ki je namenjen oblikoslovnim lastnostim glagolov, ter Database of the Western South Slavic Verb HyperVerb - Derivation (Milosavljević idr. 2023), v kateri so opisane besedotvorne lastnosti glagolov.
V prispevku se omejujemo na slovenski del baze WeSoSlaV. Predstavljen bo postopek anotacije lastnosti glagolov (lastnosti, kot so naglas, tematski vokali, predpone itd.), težave, ki so se pojavljale pri označevanju (npr. test za nedovršnost), in primer uporabe podatkov, zbranih v bazi. |
---|
Keywords: | glagol, južnoslovanski jeziki, slovenščina, pripone, predpone, korpus |
---|
Year of publishing: | 2023 |
---|
PID: | 20.500.12556/RUNG-8582-ca570840-6901-26e7-467e-3efc7a2aec71 |
---|
COBISS.SI-ID: | 168507907 |
---|
UDC: | 81'1 |
---|
NUK URN: | URN:SI:UNG:REP:PECNOPAN |
---|
Publication date in RUNG: | 16.10.2023 |
---|
Views: | 1633 |
---|
Downloads: | 7 |
---|
Metadata: | |
---|
:
|
Copy citation |
---|
| | | Average score: | (0 votes) |
---|
Your score: | Voting is allowed only for logged in users. |
---|
Share: | |
---|
Hover the mouse pointer over a document title to show the abstract or click
on the title to get all document metadata. |