Določanje ključnih besed in tematik besedilRobida, Nika (Avtor) Lužar, Borut (Mentor) ekstrakcija ključnih beseddoločanje tematikkoherencaTwitterpredpriprava besedilZ vedno večjo količino besedilnih vsebin postajajo učinkovita obdelava, analiza in razumevanje teh besedil ključni za številne naloge, vključno z razvrščanjem besedil v kategorije, izboljšanjem iskalnih algoritmov, generiranjem povzetkov ter spremljanjem in analizo trendov. Poseben izziv predstavlja analiza kratkih in neformalnih besedil, kot so objave na družbenih omrežjih. Naša raziskava se osredotoča na dve ključni področji: ekstrakcijo ključnih besed in določanje tematik besedil. Za ekstrakcijo ključnih besed smo implementirali in analizirali štiri algoritme: RAKE, TextRank, YAKE in KeyBERT, za določanje tematik besedil pa smo preučili algoritme: LDA, prodLDA, NMF in BERTopic. Cilj naše raziskave je oceniti učinkovitost in zanesljivost teh algoritmov ter izbrati najprimernejšega za specifične potrebe, s posebnim poudarkom na boljši analizi in razumevanju kratkih, neformalnih besedil. Kot rezultat med drugim potrdimo, da se učinkovitost algoritmov spreminja glede na vrsto besedila.N. Robida20242024-12-03 12:30:30Magistrsko delo/naloga11070UDK: 004.93(043.2)COBISS_ID: 215810819sl