1. Razvoj specializiranega velikega jezikovnega modela za analizo medijskih besedilJon Petek, 2026, ni določena Opis: Magistrska naloga obravnava razvoj specializiranega velikega jezikovnega modela za slovenščino, namenjenega celoviti analizi medijskih besedil. V ospredju je izziv obvladovanja dezinformacij, pristranskosti in polarizacije medijskega prostora, ki zahteva napredna orodja za podporo medijski pismenosti in preverjanju dejstev. Razvita rešitev združuje večopravilno arhitekturo, ki omogoča sočasno izvajanje štirih ključnih nalog: tematsko kategorizacijo, analizo sentimenta, zaznavanje politične pristranskosti ter ocenjevanje verodostojnosti virov.
V raziskavi je bil zbran in anotiran obsežen korpus slovenskih medijskih besedil, ki je služil kot učna zbirka za prilagoditev (fine-tuning) obstoječega transformacijskega modela GaMS-9B-Instruct. Nastali model, poimenovan »Klasifikacijski model za medijsko analizo« (KMMA), uporablja večglavo arhitekturo, kjer skupna jedrna plast deli predstavitve med nalogami, izhodne plasti pa so specializirane za posamezne analize. Tak pristop omogoča prenos znanja med nalogami in povečuje robustnost klasifikacije.
Rezultati evalvacije na ločenem testnem naboru 518 člankov so pokazali izrazito prednost KMMA v primerjavi z odprtokodnim modelom Qwen2.5-7B-Instruct in osnovnim GaMS-9B-Instruct. Povprečna natančnost našega modela presega 90 %, pri čemer dosega uravnotežene metrike makro-F1 za vse razrede. Pri tematski kategorizaciji je natančnost dosegla 93,6 %, pri analizi sentimenta 85,1 %, pri detekciji politične pristranskosti skoraj 89 %, pri oceni verodostojnosti pa 88 %. V nasprotju z obema primerjalnima modeloma KMMA uspešno prepoznava tudi redkejše razrede in ne favorizira večinskih.
Na koncu lahko sklenemo, da je naloga uspešno dosegla zastavljene cilje. Razviti model predstavlja prvo večopravilno rešitev v slovenskem jeziku, ki omogoča zanesljivo in razložljivo analizo medijskih vsebin ter pomembno prispeva k razvoju digitalnih orodij za spremljanje kakovosti in objektivnosti slovenskega medijskega prostora. Ključne besede: veliki jezikovni modeli, umetna inteligenca, analiza, klasifikacija, slovenski medijski prostor Objavljeno v ReVIS: 14.01.2026; Ogledov: 258; Prenosov: 8
Celotno besedilo (1,78 MB) |
2. OCENA SPOSOBNOSTI NAČRTOVANJA VELIKIH JEZIKOVNIH MODELOV Z UPORABO TESTA TOWER OF LONDONKatarina Žužek, 2025, ni določena Opis: V sodobni umetni inteligenci je razumevanje zmožnosti strateškega načrtovanja velikih jezikovnih modelov ključnega pomena, saj ti modeli dosegajo izjemen napredek pri obdelavi naravnega jezika in reševanju kompleksnih intelektualnih izzivov. Kljub napredku ostajajo njihove sposobnosti na področju strateškega načrtovanja, ključne za kompleksno razmišljanje, relativno premalo raziskane. Načrtovanje, kot temeljna izvršilna funkcija, vključuje zastavljanje ciljev, oblikovanje strategij in predvidevanje posledic, kar zahteva strukturirano in dolgoročno razmišljanje. V tej študiji se uporablja kognitivni test Tower of London, uveljavljen psihološki instrument, ki z nalogami preurejanja kroglic na treh palicah meri logično razmišljanje in strateške odločitve petih sodobnih velikih jezikovnih modelov – DeepSeek V3, Grok - 3, Gemini 2.0 Flash, Qwen 235B-A22B in Mistral 12B – za ovrednotenje njihove sposobnosti razumevanja navodil in reševanja nalog različnih zahtevnosti. Besedilni opisi nalog omogočajo standardizirano oceno kognitivnih zmogljivosti, medtem ko analiza v programskem okolju Python kaže razlike v uspešnosti glede na arhitekturo modelov in kompleksnost nalog. Pomembno je, da modeli ostanejo dosledni pri interpretaciji navodil in pravil premikanja, saj s tem prispevajo k zanesljivosti rezultatov. Empirični del raziskave osvetljuje potencial modelov za simulacijo kognitivnih procesov, hkrati pa opozarja na omejitve pri obvladovanju zahtevnih nalog. Metodologija vključuje uporabo ponavljajočih se meritev, binomski test, Friedmanov test s post-hoc analizo in opisno obravnavo nalog z visoko zahtevnostjo. Kognitivno testiranje je v kontekstu ocenjevanja velikih jezikovnih modelov še posebej pomembno, saj lahko pravočasno in natančno pripravljene analize pomagajo pri razumevanju mej in možnosti teh tehnologij. S tem delom želimo povezati kognitivno znanost in umetno inteligenco ter odpreti priložnosti za uporabo standardiziranih testov pri ocenjevanju naprednih kognitivnih funkcij velikih jezikovnih modelov. Ključne besede: umetna inteligenca, veliki jezikovni modeli, Tower of London, izvršilne funkcije, načrtovanje. Objavljeno v ReVIS: 19.12.2025; Ogledov: 267; Prenosov: 7
Celotno besedilo (1,40 MB) |
3. S poizvedovanjem obogateno generiranje teksta za delo z dokumentacijo s področja naravovarstva : magistrska nalogaGregor Gatej, 2025, magistrsko delo Opis: Zavod Republike Slovenije za varstvo narave (ZRSVN) se srečuje s težavo učinkovitega pridobivanja informacij iz obsežne zbirke dokumentov o spremljanju stanja živalskih in rastlinskih vrst, kar gre pripisati nestrukturirani naravi dokumentov. Namen magistrske naloge je razviti praktično rešitev, ki bo omogočila hitrejši in natančnejši dostop do informacij iz navedenih dokumentov. Naloga obsega pripravo in strukturiranje besedilnega korpusa, razvoj prototipa sistema za s poizvedovanjem obogateno generiranje teksta (ang. Retrieval Augmented Generation ali s kratico RAG) ter izdelavo spletne aplikacije za evaluacijo avtomatsko generiranih vprašanj in odgovorov. Ključne besede: s poizvedovanjem obogateno generiranje teksta, naravovarstvo, iskanje, nestrukturirani podatki, avtomatska evaluacija, procesiranje naravnega jezika, veliki jezikovni modeli Objavljeno v ReVIS: 17.10.2025; Ogledov: 519; Prenosov: 21
Celotno besedilo (5,49 MB) |
4. |
5. |
6. Ocena učinkovitosti velikih jezikovnih modelov na medicinskem testiranjuDragan Gostimirović, 2024, ni določena Opis: Umetna inteligenca je ključno preoblikovala tehnološki napredek, omogočila razvoj novih pristopov za reševanje kompleksnih problemov in izboljšala učinkovitost obstoječih procesov. Med širokim spektrom tehnologij umetne inteligence so veliki jezikovni modeli, kot so GPTji, posebej pomembni zaradi svoje sposobnosti razumevanja in generiranja človeškega jezika. Razvoj od pravilnih pristopov do naprednih algoritmov strojnega učenja kaže na pomembne mejnike v raziskavah umetne inteligence. Modeli, kot sta GPT-3 in GPT-4, so revolucionirali področje z razumevanjem konteksta in generiranjem relevantnega besedila. Predstavitev ChatGPT konec leta 2022 je pomenila prelomni trenutek, ki je omogočil generativnim jezikovnim modelom vodenje smiselnih pogovorov in izvajanje intelektualnih nalog. To je odprlo nove možnosti uporabe umetne inteligence v izobraževanju, programiranju in ustvarjanju vsebine, hkrati pa postavilo nova etična in praktična vprašanja. Magistrsko delo se osredotoča na analizo zmogljivosti GPT modelov – konkretno ChatGPT-3.5, ChatGPT-4, Copilot in Gemini, pri opravljanju medicinskega testa pa USMLE Step 1 2022. S študijo želimo oceniti njihovo sposobnost obdelave in razumevanja medicinskega znanja. Analiza bo izvedena z uporabo statističnega orodja PSPP, ki bo omogočilo učinkovito obdelavo in interpretacijo zbranih podatkov. Ključne besede: Umetna inteligenca, veliki jezikovni modeli, GPT, ChatGPT, USMLE Step 1 2022. Objavljeno v ReVIS: 27.06.2024; Ogledov: 2336; Prenosov: 21
Celotno besedilo (18,40 MB) |