IMDb Top 1000: Ærlig vs. villedende fremstillinger
Her bruker vi det samme datasettet til å fortelle to ganske
ulike historier. Først får du en ryddig og ærlig tolkning av
dataene, der vi viser utviklingen over tid og spredningen i
materialet. Deretter skrur vi på noen klassiske grep for å få
moderne filmer til å fremstå ekstra imponerende. En liten
påminnelse om hvor mye designvalg faktisk styrer hvordan vi
tolker data.
Ærlig visning: median per år med spredning
Årsmedian med interkvartilspenn (25.–75. persentil).
Her prøver vi å være tydelige på valgene vi tar. For hvert år
beregner vi medianen som et robust mål på sentraltendens, og
viser interkvartilspennet (fra første til tredje kvartil) for å
gjøre variasjonen i ratingene synlig. Alle titlene i
Top-1000-utvalget er med, men vi utelater år med færre enn tre
filmer for å unngå ustabile estimater. Husk også at dette
fortsatt er et selektert utvalg – det er de høyest rangerte
filmene, ikke en full populasjon av alle utgivelser.
Villedende visning: "Den moderne renessansen"
Gjennomsnittlig rating per tiår (Top-1000-utvalg).
Nå gjør vi det motsatte – med vilje. Vi bruker gjennomsnitt i
stedet for median (som er mer følsomt for ekstreme verdier),
kutter y-aksen slik at små forskjeller ser store ut, aggregerer
per tiår og skjuler dermed variasjon mellom enkeltår, og velger
et snevert tidsvindu. Sammen med ladede farger gir dette
inntrykk av et tydelig moderne oppsving. Under ser du antall
filmer per tiår – noe som forklarer hvorfor særlig 2020-tallet
er sårbart for overtolkning.
Tellinger: antall filmer per tiår
Den lille detaljen som setter historien i perspektiv.