IMDb Top 1000: Ærlig vs. villedende fremstillinger

Her bruker vi det samme datasettet til å fortelle to ganske ulike historier. Først får du en ryddig og ærlig tolkning av dataene, der vi viser utviklingen over tid og spredningen i materialet. Deretter skrur vi på noen klassiske grep for å få moderne filmer til å fremstå ekstra imponerende. En liten påminnelse om hvor mye designvalg faktisk styrer hvordan vi tolker data.

Ærlig visning: median per år med spredning

Årsmedian med interkvartilspenn (25.–75. persentil).

Her prøver vi å være tydelige på valgene vi tar. For hvert år beregner vi medianen som et robust mål på sentraltendens, og viser interkvartilspennet (fra første til tredje kvartil) for å gjøre variasjonen i ratingene synlig. Alle titlene i Top-1000-utvalget er med, men vi utelater år med færre enn tre filmer for å unngå ustabile estimater. Husk også at dette fortsatt er et selektert utvalg – det er de høyest rangerte filmene, ikke en full populasjon av alle utgivelser.

Villedende visning: "Den moderne renessansen"

Gjennomsnittlig rating per tiår (Top-1000-utvalg).

Nå gjør vi det motsatte – med vilje. Vi bruker gjennomsnitt i stedet for median (som er mer følsomt for ekstreme verdier), kutter y-aksen slik at små forskjeller ser store ut, aggregerer per tiår og skjuler dermed variasjon mellom enkeltår, og velger et snevert tidsvindu. Sammen med ladede farger gir dette inntrykk av et tydelig moderne oppsving. Under ser du antall filmer per tiår – noe som forklarer hvorfor særlig 2020-tallet er sårbart for overtolkning.

Tellinger: antall filmer per tiår

Den lille detaljen som setter historien i perspektiv.