IMDb fører en liste over de tusen høyest rangerte filmene
gjennom historien, et tverrsnitt av hva publikum har verdsatt
over tid. Men hva forteller egentlig ratingene oss? Det avhenger
overraskende mye av hvordan vi velger å presentere dem. Her tar
vi det samme datasettet og viser to ulike versjoner: én som
forsøker å være ærlig om hva tallene faktisk sier, og én som
bruker klassiske visualiseringsgrep til å skape et bestemt
inntrykk. Se om du legger merke til forskjellen, og hva som
avgjør hvilken versjon du fester lit til.
Her prøver vi å være tydelige på valgene vi tar. For hvert år
beregner vi medianen som et robust mål på sentraltendens, og
viser interkvartilspennet (fra første til tredje kvartil) for å
gjøre variasjonen i ratingene synlig. Alle titlene i
Top-1000-utvalget er med, men vi utelater år med færre enn tre
filmer for å unngå ustabile estimater. Husk også at dette
fortsatt er et selektert utvalg, det er de høyest rangerte
filmene, ikke en full populasjon av alle utgivelser.
Ærlig visning: median per år med spredning
Årsmedian med interkvartilspenn (25.–75. persentil).
Nå gjør vi det motsatte, med vilje. Vi bruker gjennomsnitt i
stedet for median (som er mer følsomt for ekstreme verdier),
kutter y-aksen slik at små forskjeller ser store ut, aggregerer
per tiår og skjuler dermed variasjon mellom enkeltår, og velger
et snevert tidsvindu. Sammen med ladede farger gir dette
inntrykk av et tydelig moderne oppsving.
Villedende visning: "Den moderne renessansen"
Gjennomsnittlig rating per tiår (Top-1000-utvalg).
Denne oversikten viser hvor mange filmer fra IMDb Top-1000-lista som
stammer fra hvert tiår. Det er en nøkkeldetalj for å forstå den
villedende visningen over: jo færre filmer et tiår bidrar med, desto
mer ustabilt er gjennomsnittet. 2020-tallene er særlig sårbare, med
bare 6 filmer i utvalget så langt. Slike skjevheter er lette å
overse, men avgjørende for tolkningen.
Antall filmer per tiår
Den lille detaljen som setter historien i perspektiv.