20.500.12556/RUNG-3255-4add7851-27fd-1eba-eea9-d70e5694d069
Kvantitativni oris romanov Ivana Preglja
Quantitative outline of Ivan Pregelj's novels
Diplomska naloga obravnava kvantitativno analizo romanov primorskega pisatelja Ivana Preglja, ki je ena izmed redkih takega obsega v slovenskem prostoru poleg podobne analize opusa Cirila Kosmača. Izhodišče tovrstnih analiz je elektronska verzija romanov. Analiza slovenskega dela besedil vseh treh romanov je bila opravljena s programskim orodjem Eva in s spletno različico prostodostopnega statističnega oblikovnoskladenjskega označevalnika in lematizatorja za slovenski jezik Obeliks ter vključuje tudi oblikoslovno označitev in lematizacijo celotnega besedila, katere izsledki so bili ročno popravljeni in pregledani. Pri kvantitativni analizi romanov je bila uporabljena statistična metoda, ki prinaša statistične prikaze znakov, črk, besed in povedi. V veliki večini so podatki predstavljeni za vsak roman posebej in za celotno besedilo, dodane so primerjave z rezultati analize besedil Cirila Kosmača. Diplomska naloga prinaša dopolnitve in nadgradnje dosedanjih raziskav o Pregljevih romanih, ki v to smer še niso posegle. Poglavitna dela naloge, seznam vseh lem s podatki o besedni vrsti ter pogostostmi po posameznih romanih in pa seznam delov besedil v tujih jezikih se nahajata v prilogah.
The diploma thesis deals with the quantitative analysis of novels, written by the Slovenian writer Ivan Pregelj, from Primorska region. This kind of analysis is still rare – in Slovenian academic sphere just one such research was made, of the Ciril Kosmač opus. Starting point of such analyses is the electronic version of text. The analysis of Slovenian language part of text of all three novels was made with the lingware Eva and web version of the program Obeliks which includes morphological markup and lemmatisation of text. In the thesis the outcome of Obeliks lemmatizer was proof-read and corrected. The statistical description of special characters, letters, words and sentences was used for the quantitative analysis of particular novel and for the whole lot. Data obtained were compared to results of the analysis of the Ciril Kosmač's texts. The diploma thesis complements previous research on Pregelj's novels. The most important part of the thesis are the list of lemmas with part of speech data and frequencies per particular novel, and the list of citations in non-Slovenian languages. Both are given in Appendix 1 and Appendix 2.
Ivan Pregelj
kvantitativna analiza besedil
statistična metoda
roman
oblikoslovno označevanje
lematizacija
znak
črka
beseda
poved
besedna vrsta.
Ivan Pregelj
quantitative text analysis
statistical method
novel
part of speech tagging
lemmatisation
special character
letter
word
sentence
part of speech.
true
true
false
Slovenski jezik
Angleški jezik
Diplomsko delo/naloga
2017-09-04 11:35:15
2017-09-19 07:21:55
2023-06-09 03:21:21
0000-00-00 00:00:00
2017
0
Nova Gorica
0
0000-00-00
NiDoloceno
NiDoloceno
NiDoloceno
0000-00-00
0000-00-00
0000-00-00
4917499
URN:SI:UNG:REP:NSJCGZW1
Anej_Zagar.pdf
Anej_Zagar.pdf
1
273BC71C70AC70DA70C9C67195409EC1
1c4f20ac8bc92f1126e555a44154c6245f9448d8581f4edff4de640dc1b0d72d
38f33005-05ce-11ee-9c48-5ef991fed68f
https://repozitorij.ung.si/Dokument.php?lang=slv&id=13969
Fakulteta za humanistiko
0
0
0