| Naslov: | Razvoj specializiranega velikega jezikovnega modela za analizo medijskih besedil |
|---|
| Avtorji: | ID Petek, Jon (Avtor) ID Rončević, Borut (Mentor) Več o mentorju...  ID Mileva Boshkoska, Biljana (Komentor) |
| Datoteke: | 16434$$zakljucno_delo.pdf (1,78 MB) MD5: 41D578FA9D4613852566D245E7F146DF
|
|---|
| Jezik: | Slovenski jezik |
|---|
| Vrsta gradiva: | Magistrsko delo/naloga |
|---|
| Organizacija: | FUDS - Fakulteta za uporabne družbene študije
|
|---|
| Opis: | Magistrska naloga obravnava razvoj specializiranega velikega jezikovnega modela za slovenščino, namenjenega celoviti analizi medijskih besedil. V ospredju je izziv obvladovanja dezinformacij, pristranskosti in polarizacije medijskega prostora, ki zahteva napredna orodja za podporo medijski pismenosti in preverjanju dejstev. Razvita rešitev združuje večopravilno arhitekturo, ki omogoča sočasno izvajanje štirih ključnih nalog: tematsko kategorizacijo, analizo sentimenta, zaznavanje politične pristranskosti ter ocenjevanje verodostojnosti virov.
V raziskavi je bil zbran in anotiran obsežen korpus slovenskih medijskih besedil, ki je služil kot učna zbirka za prilagoditev (fine-tuning) obstoječega transformacijskega modela GaMS-9B-Instruct. Nastali model, poimenovan »Klasifikacijski model za medijsko analizo« (KMMA), uporablja večglavo arhitekturo, kjer skupna jedrna plast deli predstavitve med nalogami, izhodne plasti pa so specializirane za posamezne analize. Tak pristop omogoča prenos znanja med nalogami in povečuje robustnost klasifikacije.
Rezultati evalvacije na ločenem testnem naboru 518 člankov so pokazali izrazito prednost KMMA v primerjavi z odprtokodnim modelom Qwen2.5-7B-Instruct in osnovnim GaMS-9B-Instruct. Povprečna natančnost našega modela presega 90 %, pri čemer dosega uravnotežene metrike makro-F1 za vse razrede. Pri tematski kategorizaciji je natančnost dosegla 93,6 %, pri analizi sentimenta 85,1 %, pri detekciji politične pristranskosti skoraj 89 %, pri oceni verodostojnosti pa 88 %. V nasprotju z obema primerjalnima modeloma KMMA uspešno prepoznava tudi redkejše razrede in ne favorizira večinskih.
Na koncu lahko sklenemo, da je naloga uspešno dosegla zastavljene cilje. Razviti model predstavlja prvo večopravilno rešitev v slovenskem jeziku, ki omogoča zanesljivo in razložljivo analizo medijskih vsebin ter pomembno prispeva k razvoju digitalnih orodij za spremljanje kakovosti in objektivnosti slovenskega medijskega prostora. |
|---|
| Ključne besede: | veliki jezikovni modeli, umetna inteligenca, analiza, klasifikacija, slovenski medijski prostor |
|---|
| Leto izida: | 2026 |
|---|
| PID: | 20.500.12556/ReVIS-12921  |
|---|
| Datum objave v ReVIS: | 14.01.2026 |
|---|
| Število ogledov: | 179 |
|---|
| Število prenosov: | 1 |
|---|
| Metapodatki: |  |
|---|
|
:
|
Kopiraj citat |
|---|
| | | | Objavi na: |  |
|---|
Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše
podrobnosti ali sproži prenos. |