1. Podatkovna baza WeSoSlaV kot izhodišče za preučevanje slovenskih glagolov : predavanje na Mednarodnem dnevu slovarjev 2023, Slovarji na obronkih našega prostora, časa in družbe, 16. 10. 2023Petra Mišmaš, Franc Marušič, Rok Žaucer, 2023, prispevek na konferenci brez natisa Opis: Pomen besedilnih korpusov za slovaropisje in jezikovne raziskave je v zadnjem času postal zelo očiten. Hkrati pa se zasledi tudi mnenje, da so potrebe po korpusih zadoščene s čim večjim splošnim korpusom tipa Gigafida 2.0 in s še kakšnim specializiranim korpusom spletnih besedil (npr. slWaC, JANES), besedil določenega zgodovinskega obdobja (npr. Korpus 16), govorjenih besedil (npr. GoS), šolskih besedil (npr. Šolar) ipd. V prispevku bomo predstavili primer podatkovne baze, ki je nastala zaradi specifičnih raziskovalnih potreb, ki jih omenjeni korpusi ne morejo zadostiti.
V bazi glagolov zahodnih južnoslovanskih jezikov WeSoSlaV (Western South Slavic Verbs) sta združeni podatkovna baza slovenskih glagolov in podatkovna baza, ki združuje glagole iz bosanščine, črnogorščine, hrvaščine in srbščine (BČHS). Za vsak navedeni jezik je v bazo vključenih po tri tisoč glagolov, pri čemer končno število glagolov za BČHS zaradi podvajanja glagolov med različicami BČHS ni 12.000 temveč 5.300. Do septembra 2023 sta v spletnem repozitoriju Slovenske raziskovalne infrastrukture za jezikovne vire in tehnologije CLARIN.SI objavljena dva dela baze WeSoSlaV, in sicer Database of the Western South Slavic Verb HyperVerb 1.0 (Marušič idr. 2022), ki je namenjen oblikoslovnim lastnostim glagolov, ter Database of the Western South Slavic Verb HyperVerb - Derivation (Milosavljević idr. 2023), v kateri so opisane besedotvorne lastnosti glagolov.
V prispevku se omejujemo na slovenski del baze WeSoSlaV. Predstavljen bo postopek anotacije lastnosti glagolov (lastnosti, kot so naglas, tematski vokali, predpone itd.), težave, ki so se pojavljale pri označevanju (npr. test za nedovršnost), in primer uporabe podatkov, zbranih v bazi. Ključne besede: glagol, južnoslovanski jeziki, slovenščina, pripone, predpone, korpus Objavljeno v RUNG: 16.10.2023; Ogledov: 1382; Prenosov: 7 Povezava na datoteko Gradivo ima več datotek! Več... |
2. Odprta vprašanja pri prenosu označevalne sheme Universal dependencies na slovenska besedila : priloga k smernicam za označevanje besedil v slovenščiniKaja Dobrovoljc, Franc Marušič, Petra Mišmaš, Rok Žaucer, 2023, elaborat, predštudija, študija Ključne besede: slovenščina, Universal dependencies, korpus, slovnično označevanje, oblikoslovje, skladnja, poročila Objavljeno v RUNG: 14.09.2023; Ogledov: 1414; Prenosov: 8 Povezava na datoteko Gradivo ima več datotek! Več... |
3. |
4. Korpus Šolar in zanesljivost ocenjevanja šolskih pisnih nalog na različnih stopnjah šolanja emagistrsko deloMarjana Tinta, 2019, magistrsko delo Opis: V magistrskem delu je narejena primerjava slovničnih in slogovnih popravkov šolskih pisnih nalog v korpusu Šolar in skupini učiteljev prostovoljcev. Predstavljeni so popravki, ki so v korpusu razvrščeni po tipih: napake zapisa, napake besedišča, napake oblike in napake skladnje, in sicer tudi z vidika pogostnosti. Predstavljene so raziskave o problemih pri objektivnosti ocenjevanja. V empiričnem delu je narejena podrobna analiza popravkov v treh izbranih pisnih izdelkih iz korpusa Šolar, ki jih je popravila skupina devetih učiteljev slovenščine v srednjih in osnovnih šolah. Ugotovljeno je bilo, da so pravopisno-oblikoslovni popravki po pričakovanjih med sabo bolj prekrivni, medtem ko prihaja pri stilnih in skladenjskih do odstopanj. Neujemanje ugotavljam tudi pri ocenah ocenjevalcev. Ključne besede: korpus Šolar, napake zapisa, napake besedišča, napake oblike, napake skladnje, neustrezno črkovanje, neustrezna raba ločil, napake pisanja skupaj oziroma narazen, napake pisanja z malo oziroma veliko začetnico, napake zapisa številk, napake besednega reda, napake izpusta, napake odvečnih podatkov, napake strukture, objektivnost ocenjevanja, zanesljivost med ocenjevalci Objavljeno v RUNG: 23.10.2019; Ogledov: 4771; Prenosov: 204 Celotno besedilo (1,15 MB) |
5. Svojilni pridevniki iz samostalnikov 2. moške sklanjatveAna Cukjati, 2016, diplomsko delo Opis: V diplomski nalogi preverjam, katera končnica prevladuje pri svojilnih pridevnikih iz samostalnikov 2. moške sklanjatve v dejanski rabi. Glede na Slovensko slovnico (Toporišič 2000: 196) naj bi to bila končnica -ov-/-ev-, vendar se v rabi pojavlja tudi končnica -in-. V diplomski nalogi raziskujem svojilne pridevnike iz tistih samostalnikov 2. moške sklanjatve, ki jih kot primere podskupin te sklanjatve omenja Plesničarjeva (2012) – zanima me namreč, ali podskupine, ki jih omenja, vplivajo na izbiro končnice svojilnih pridevnikov. Le-te najprej preverjam v korpusu Gigafida, in sicer najprej v vseh korpusnih besedilih, nato pa samo v internetnih besedilih v Gigafidi. Izbiro končnice svojilnih pridevnikov iz samostalnikov 2. moške sklanjatve preverjam tudi s sestavljenim vprašalnikom, na katerega je odgovarjalo 50 ljudi. Korpusni rezultati kažejo, da pri svojilnih pridevnikih iz samostalnikov 2. moške sklanjatve večinoma prevladuje končnica -ov-/-ev-, podobno kažejo tudi rezultati vprašalnika, le da se tu končnica -in- relativno pojavlja večkrat. Rezultati celotne raziskave kažejo, da se končnica -in- večkrat pojavlja na samostalnikih 1. skupine 2. moške sklanjatve, kar posredno dodatno upravičuje postulacijo podskupin, ki jih odkriva Plesničarjeva (2012). Pri pridevnikih iz samostalnikov 1. skupine 2. moške sklanjatve torej prihaja do kar velikega razkoraka med rabo in normo, ki zapoveduje, naj imajo vsi samostalniki moškega spola svojilnopridevniško končnico -ov-/-ev- (Toporišič 2000: 196). Ključne besede: 2. moška sklanjatev, svojilni pridevniki, oblikoslovje, korpus, vprašalnik. Objavljeno v RUNG: 30.11.2016; Ogledov: 8641; Prenosov: 335 Celotno besedilo (1,12 MB) |