<?xml version="1.0" encoding="utf-8"?>
<Gradivo ID="11070" NadgradivoID="0" NRID="25449003" OceID="0" DomainUrl="https://revis.openscience.si/" IzpisPolniUrl="https://revis.openscience.si/IzpisGradiva.php?lang=slv&amp;id=11070" StOgledov="1753" StPrenosov="70" StOcen="0" VsotaOcen="0" DatumIzvoza="2026-05-10 06:52:26" OcenaSkupna="0" StPodgradiv="0" StudijskiProgramEvsID="" JeIndeksirano="0" JeVecAvtorjev="0" DovoliZahtevkeZaDostop="0">
  <PID Url="http://hdl.handle.net/20.500.12556/ReVIS-11070">20.500.12556/ReVIS-11070</PID>
  <Naslov>Določanje ključnih besed in tematik besedil</Naslov>
  <Podnaslov>magistrska naloga</Podnaslov>
  <TujJezik_Naslov></TujJezik_Naslov>
  <TujJezik_Podnaslov></TujJezik_Podnaslov>
  <Opis>Z vedno večjo količino besedilnih vsebin postajajo učinkovita obdelava, analiza in razumevanje teh besedil ključni za številne naloge, vključno z razvrščanjem besedil v kategorije, izboljšanjem iskalnih algoritmov, generiranjem povzetkov ter spremljanjem in analizo trendov. Poseben izziv predstavlja analiza kratkih in neformalnih besedil, kot so objave na družbenih omrežjih. Naša raziskava se osredotoča na dve ključni področji: ekstrakcijo ključnih besed in določanje tematik besedil. Za ekstrakcijo ključnih besed smo implementirali in analizirali štiri algoritme: RAKE, TextRank, YAKE in KeyBERT, za določanje tematik besedil pa smo preučili algoritme: LDA, prodLDA, NMF in BERTopic. Cilj naše raziskave je oceniti učinkovitost in zanesljivost teh algoritmov ter izbrati najprimernejšega za specifične potrebe, s posebnim poudarkom na boljši analizi in razumevanju kratkih, neformalnih besedil. Kot rezultat med drugim potrdimo, da se učinkovitost algoritmov spreminja glede na vrsto besedila.</Opis>
  <TujJezik_Opis>With the increasing amount of textual content, effective processing, analysis, and understanding of texts are becoming crucial for various tasks, including text classification, improving search algorithms, generating summaries, and monitoring and analyzing trends. A particular challenge lies in the analysis of short and informal texts, such as social media posts. Our research focuses on two key areas: keyword extraction and topic modeling. For keyword extraction, we implemented and analyzed four algorithms: RAKE, TextRank, YAKE, and KeyBERT. For topic modeling, we studied the algorithms LDA, prodLDA, NMF, and BERTopic. The goal of our research is to evaluate the effectiveness and reliability of these algorithms and select the most suitable one for specific needs, with a particular emphasis on better analysis and understanding of short, informal texts. Among other findings, we confirm that efficiency of algorithms varies depending on the type of text.</TujJezik_Opis>
  <KljucneBesede>
    <Beseda>ekstrakcija ključnih besed</Beseda>
    <Beseda>določanje tematik</Beseda>
    <Beseda>koherenca</Beseda>
    <Beseda>Twitter</Beseda>
    <Beseda>predpriprava besedil</Beseda>
  </KljucneBesede>
  <TujJezik_KljucneBesede>
    <Beseda>keyword extraction</Beseda>
    <Beseda>topic modeling</Beseda>
    <Beseda>coherence</Beseda>
    <Beseda>Twitter</Beseda>
    <Beseda>text preprocessing</Beseda>
  </TujJezik_KljucneBesede>
  <Potrjeno>true</Potrjeno>
  <JeZaklenjeno>true</JeZaklenjeno>
  <JeRecenzirano>false</JeRecenzirano>
  <Zaloznik>N. Robida</Zaloznik>
  <Izvor></Izvor>
  <Jezik ID="1060" ISO639-3="slv">Slovenski jezik</Jezik>
  <TujJezik ID="1033" ISO639-3="eng">Angleški jezik</TujJezik>
  <Povezave></Povezave>
  <Pokrivanje></Pokrivanje>
  <CasovnoPokritje></CasovnoPokritje>
  <AvtorskePravice></AvtorskePravice>
  <VrstaGradiva ID="mb22" DRIVER="info:eu-repo/semantics/masterThesis">Magistrsko delo/naloga</VrstaGradiva>
  <DatumVstavljanja>2024-12-03 12:30:30</DatumVstavljanja>
  <DatumObjave>2024-12-03 12:30:30</DatumObjave>
  <DatumSpremembe>2025-02-07 03:17:48</DatumSpremembe>
  <DatumTrajnegaHranjenja>0000-00-00 00:00:00</DatumTrajnegaHranjenja>
  <LetoIzida>2024</LetoIzida>
  <LetoIzidaDo>0</LetoIzidaDo>
  <KrajIzida>Novo mesto</KrajIzida>
  <LetoIzvedbe>2024</LetoIzvedbe>
  <KrajIzvedbe>Novo mesto</KrajIzvedbe>
  <Opomba>Na ov.: Magistrska naloga : študijskega programa druge stopnje;
</Opomba>
  <StStrani>XVII, 127 str.</StStrani>
  <StevilcenjeNivo1></StevilcenjeNivo1>
  <StevilcenjeNivo2></StevilcenjeNivo2>
  <Kronologija></Kronologija>
  <Patent_Stevilka></Patent_Stevilka>
  <Patent_DatumVeljavnosti>0000-00-00</Patent_DatumVeljavnosti>
  <VerzijaDokumenta>NiDoloceno</VerzijaDokumenta>
  <StatusObjaveDrugje>NiDoloceno</StatusObjaveDrugje>
  <VrstaStroskaObjave>NiDoloceno</VrstaStroskaObjave>
  <DatumPoslanoVRecenzijo>0000-00-00</DatumPoslanoVRecenzijo>
  <DatumSprejetjaClanka>0000-00-00</DatumSprejetjaClanka>
  <DatumObjaveClanka>0000-00-00</DatumObjaveClanka>
  <Licence>
    <Licenca ID="1" Kratica="CC BY-NC-ND 4.0" Naziv="Creative Commons Priznanje avtorstva-Nekomercialno-Brez predelav 4.0 Mednarodna" URL="http://creativecommons.org/licenses/by-nc-nd/4.0/deed.sl" Logo="by-nc-nd.eu.png" LogoPolniUrl="https://revis.openscience.si/teme/revis/img/licence/by-nc-nd.eu.png" DatumZacetkaLicenciranja="" VezanoNa="" VezanoNaAng="" Besedilo="" BesediloAng=""></Licenca>
  </Licence>
  <EmbargoDo></EmbargoDo>
  <VrstaEmbarga ID="1" Naziv="Takojšnja javna objava" OpenAIREDostop="openAccess"></VrstaEmbarga>
  <Osebe>
    <Oseba ID="10330" Ime="Nika" Priimek="Robida" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="418502915" Afiliacija="" ArrsID="59672" ORCID=""></Oseba>
    <Oseba ID="4064" Ime="Borut" Priimek="Lužar" AltIme="Bortut Luar" VlogaID="991" VlogaNaziv="Mentor" ConorID="143683427" Afiliacija="" ArrsID="31670" ORCID=""></Oseba>
  </Osebe>
  <Identifikatorji>
    <Identifikator ID="4" Sifra="UDK" Naziv="UDK" URL="">004.93(043.2)</Identifikator>
    <Identifikator ID="3" Sifra="CobissID" Naziv="COBISS_ID" URL="https://plus.cobiss.net/cobiss/si/sl/bib/215810819">215810819</Identifikator>
  </Identifikatorji>
  <Datoteke>
    <Datoteka ID="12650" DatotekaNRID="14003753" NamenDatotekeID="2" NamenDatoteke="Predstavitvena datoteka" FormatDatotekeID="2" FormatDatoteke=".pdf" MIME="application/pdf" IkonaFormata="pdf.gif" IkonaFormataPolniUrl="https://revis.openscience.si/teme/revis/img/fileTypes/pdf.gif" VelikostDatoteke="3635874" VelikostDatotekeKratko="3,47 MB" DatumVstavljanja="2024-12-03 12:35:06" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="0">
      <Naziv>MAG_2024_Nika_Robida.pdf</Naziv>
      <OrgNaziv>MAG_2024_Nika_Robida.pdf</OrgNaziv>
      <URL></URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>791CA3DAA8AFCD0ADA8BB4BEB9DF4D8D</MD5>
      <SHA256>6924e33d7eadf85f13deaf4f50969045efaeef7f3d6756f22ffa74e7b034f131</SHA256>
      <UUID>a4efd6af-b16a-11ef-ba3f-001a4af901a5</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://revis.openscience.si/Dokument.php?lang=slv&amp;id=12650</PrenosPolniUrl>
      <Vsebine>
        <Vsebina TipVsebine="GoloBesedilo" JezikID="1060" Oznaka="" Dolzina="248395"></Vsebina>
      </Vsebine>
    </Datoteka>
  </Datoteke>
  <Organizacije>
    <Organizacija OrganizacijaID="42" Kratica="FIŠ" ZavodEvsID="0000102" Logo="" LogoPolniUrl="https://revis.openscience.si/teme/revis/img/logo/">Fakulteta za informacijske študije v Novem mestu</Organizacija>
  </Organizacije>
  <OrganizacijeVira>
  </OrganizacijeVira>
  <MetodeZbiranjaPodatkov>
  </MetodeZbiranjaPodatkov>
  <TipologijaDela ID="2.09" Koda="2.09" Naziv="Magistrsko delo" SchemaOrg="Thesis"></TipologijaDela>
  <Ostalo>
    <StIrodsDatotek>0</StIrodsDatotek>
    <StDatotekPodTrajnimEmbargom>0</StDatotekPodTrajnimEmbargom>
    <StDatotekZOmejenimDostopom>0</StDatotekZOmejenimDostopom>
  </Ostalo>
</Gradivo>
