| Naslov: | OCENA SPOSOBNOSTI NAČRTOVANJA VELIKIH JEZIKOVNIH MODELOV Z UPORABO TESTA TOWER OF LONDON |
|---|
| Avtorji: | ID Žužek, Katarina (Avtor) ID Gams, Matjaž (Mentor) Več o mentorju...  |
| Datoteke: | 1305$$mag_zuzek_katarina.pdf (1,40 MB) MD5: ACAF49BD29FBA2FE6C0D0D6C985D1CCD
|
|---|
| Jezik: | Slovenski jezik |
|---|
| Vrsta gradiva: | Magistrsko delo/naloga |
|---|
| Organizacija: | UNM FEI - Univerza v Novem mestu - Fakulteta za ekonomijo in informatiko
|
|---|
| Opis: | V sodobni umetni inteligenci je razumevanje zmožnosti strateškega načrtovanja velikih jezikovnih modelov ključnega pomena, saj ti modeli dosegajo izjemen napredek pri obdelavi naravnega jezika in reševanju kompleksnih intelektualnih izzivov. Kljub napredku ostajajo njihove sposobnosti na področju strateškega načrtovanja, ključne za kompleksno razmišljanje, relativno premalo raziskane. Načrtovanje, kot temeljna izvršilna funkcija, vključuje zastavljanje ciljev, oblikovanje strategij in predvidevanje posledic, kar zahteva strukturirano in dolgoročno razmišljanje. V tej študiji se uporablja kognitivni test Tower of London, uveljavljen psihološki instrument, ki z nalogami preurejanja kroglic na treh palicah meri logično razmišljanje in strateške odločitve petih sodobnih velikih jezikovnih modelov – DeepSeek V3, Grok - 3, Gemini 2.0 Flash, Qwen 235B-A22B in Mistral 12B – za ovrednotenje njihove sposobnosti razumevanja navodil in reševanja nalog različnih zahtevnosti. Besedilni opisi nalog omogočajo standardizirano oceno kognitivnih zmogljivosti, medtem ko analiza v programskem okolju Python kaže razlike v uspešnosti glede na arhitekturo modelov in kompleksnost nalog. Pomembno je, da modeli ostanejo dosledni pri interpretaciji navodil in pravil premikanja, saj s tem prispevajo k zanesljivosti rezultatov. Empirični del raziskave osvetljuje potencial modelov za simulacijo kognitivnih procesov, hkrati pa opozarja na omejitve pri obvladovanju zahtevnih nalog. Metodologija vključuje uporabo ponavljajočih se meritev, binomski test, Friedmanov test s post-hoc analizo in opisno obravnavo nalog z visoko zahtevnostjo. Kognitivno testiranje je v kontekstu ocenjevanja velikih jezikovnih modelov še posebej pomembno, saj lahko pravočasno in natančno pripravljene analize pomagajo pri razumevanju mej in možnosti teh tehnologij. S tem delom želimo povezati kognitivno znanost in umetno inteligenco ter odpreti priložnosti za uporabo standardiziranih testov pri ocenjevanju naprednih kognitivnih funkcij velikih jezikovnih modelov. |
|---|
| Ključne besede: | umetna inteligenca, veliki jezikovni modeli, Tower of London, izvršilne funkcije, načrtovanje. |
|---|
| Leto izida: | 2025 |
|---|
| PID: | 20.500.12556/ReVIS-12860  |
|---|
| Datum objave v ReVIS: | 19.12.2025 |
|---|
| Število ogledov: | 25 |
|---|
| Število prenosov: | 0 |
|---|
| Metapodatki: |  |
|---|
|
:
|
Kopiraj citat |
|---|
| | | | Objavi na: |  |
|---|
Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše
podrobnosti ali sproži prenos. |