<?xml version="1.0"?>
<metadata xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dc="http://purl.org/dc/elements/1.1/"><dc:title>Določanje ključnih besed in tematik besedil</dc:title><dc:creator>Robida,	Nika	(Avtor)
	</dc:creator><dc:creator>Lužar,	Borut	(Mentor)
	</dc:creator><dc:subject>ekstrakcija ključnih besed</dc:subject><dc:subject>določanje tematik</dc:subject><dc:subject>koherenca</dc:subject><dc:subject>Twitter</dc:subject><dc:subject>predpriprava besedil</dc:subject><dc:description>Z vedno večjo količino besedilnih vsebin postajajo učinkovita obdelava, analiza in razumevanje teh besedil ključni za številne naloge, vključno z razvrščanjem besedil v kategorije, izboljšanjem iskalnih algoritmov, generiranjem povzetkov ter spremljanjem in analizo trendov. Poseben izziv predstavlja analiza kratkih in neformalnih besedil, kot so objave na družbenih omrežjih. Naša raziskava se osredotoča na dve ključni področji: ekstrakcijo ključnih besed in določanje tematik besedil. Za ekstrakcijo ključnih besed smo implementirali in analizirali štiri algoritme: RAKE, TextRank, YAKE in KeyBERT, za določanje tematik besedil pa smo preučili algoritme: LDA, prodLDA, NMF in BERTopic. Cilj naše raziskave je oceniti učinkovitost in zanesljivost teh algoritmov ter izbrati najprimernejšega za specifične potrebe, s posebnim poudarkom na boljši analizi in razumevanju kratkih, neformalnih besedil. Kot rezultat med drugim potrdimo, da se učinkovitost algoritmov spreminja glede na vrsto besedila.</dc:description><dc:publisher>N. Robida</dc:publisher><dc:date>2024</dc:date><dc:date>2024-12-03 12:30:30</dc:date><dc:type>Magistrsko delo/naloga</dc:type><dc:identifier>11070</dc:identifier><dc:identifier>UDK: 004.93(043.2)</dc:identifier><dc:identifier>COBISS_ID: 215810819</dc:identifier><dc:language>sl</dc:language></metadata>
