Sõnapilve metoodika

Sõnapilv märksõnaga “lapsed”
Milliste sõnadega kirjeldatakse Eesti ringvaadete sisu ja kuidas see ajas muutub? Milliseid märksõnu kasutati lapsi, poliitilisi või spordisündmusi sisaldavate kaadrite kirjeldamisel? Milliste sõnadega kirjeldatakse 1930. ja 1970. aastate ringvaadete sisu? Kus näete märksõnade osas kõige suuremaid muutusi?
Teemade muutusi ringvaadetes saab visualiseerida sõnapilve abil. Need joonised on loodud metaandmetes ringvaadete kirjeldustele lisatud siltidest. Mida suurem on sõna sõnapilves, seda rohkem on seda kasutatud ringvaate sisu kirjeldamiseks.
Keegi, kes on huvitatud sellest, kuidas lapsi on ringvaadetes kujutatud, saab sõnapilves teada, et vahel on lastest filmitud kaadrid olnud sildistatud haridusega seotud sõnadega, nagu koolivorm, klassiruum või pioneerilaager, kuid on ka sotsiaalsete probleemidega (nt lastekodu) seotud sildid. Lastega seotud teemasid on käsitletud nii 1930. kui ka 1960. aastatel.
Sõnapilved on lihtne, kuid võimas viis tekstide visualiseerimiseks viisil, mis võtab kokku kõige olulisema sisu. Mida rohkem kordi sõna tekstis esineb, seda suurem on see sõnapilves. Nende sõnapilvede tegemiseks kasutasime ringvaadete metaandmete kirjeldustele lisatud silte. Nende jooniste loomiseks viime iga ringvaate iga märksõna otsingutulemustesse, arvutame nende sageduse ja sorteerime loendi kolme kõige sagedamini kasutatava märksõnaga. Võtame 250 kõige sagedamini esinevat sõna ja visualiseerimine need joonisel. Samaaegselt skaleerime sagedust suurima ja väikseima sagedusega ning arvutame vastava fondi suuruse vahemikus 8 kuni 80 pikslit, säilitades samal ajal sageduste proportsioonid otsinguloendis. Sõnade nurk arvutatakse juhuslikult vahemikus -90 kuni 90 kraadi. Kasutasime silte nii, nagu nad on, ilma neid sõna põhivormiks muutmata. See tähendab, et võite samas sõnapilves näha sama sõna erinevaid vorme. Näiteks päring sõnaga “pidu” toob esile sõnapilve, mis sisaldab silte “mikrofon” ja “mikrofonid”.