"KrF i kamp mot sperregrensen", "Mot historisk valg for Rødt", "Sp og Frp faller i fersk måling", "Årsbeste for Senterpartiet", "Småpartiene på vippen". Dette er norske avisoverskrifter i løpet av noen få dager og de omtaler alle sammen meningsmålinger som forsøker å finne ut stemningen før høstens stortingsvalg.
Ofte er overskrftene innbyrdes direkte motstridende, og det er ikke lett å se noe klart mønster, langt mindre danne seg et riktig inntrykk av stillingen, så jeg satte meg ned og laget et prognoseprogram, inspirert av amerikanske FiveThirtyEight og norske Poll of polls, for å skaffe meg selv i alle fall en viss oversikt.
Det er forskjeller og likheter fra de nevnte nettsidene. FiveThirtyEight er en stor virksomhet i seg selv, og dreier seg naturligvis om amerikanske forhold, og dessuten om en rekke andre emner enn valg. Likheten her er at jeg forsøker å anslå stillingen løpende dag for dag eller i det minste etter hver nye måling, etter en formel beskrevet under. Poll of polls ligner nok mere, men jeg har nå en litt annerledes måte å regne på, og prøver også å lage løpende prognoser for hvert enkelt fylke. Jeg skylder Poll of polls en hel del, både fordi det er dit jeg går for å finne ut hvilke nye målinger som er ute, og fordi jeg har mottatt nyttige tips fra Johan Giertsen der.
Så, hvordan regner jeg ut prognosen min? Jeg tar utgangspunkt i et glidende snitt av alle landsdekkende målinger jeg vet om. Det er et glidende snitt med en vri: I stedet for å regne snittet av f.eks siste fem, ti eller tjue målinger og bytte ut den eldste med den nyeste for hver nye måling, lager jeg et slags "tids-vektet" snitt. Jeg lar en måling av i dag telle fullt (100%), og deretter miste 5% av sin vekt for hver dag. En måling halveres da i betydning ca hver fjortende dag. (De 5% er skjønnsmessig satt etter litt eksperimentering med ulike verdier.) En annen vri er at jeg tar vare på snittet for hver dato i en egen tabell, "Kalendertabellen", der målingene også har tilbakevirkende kraft. Snittet for i dag er altså ikke ferdig utregnet før i ettertid, og dette blir viktig senere, selv om det oppgitte tallet i prognosen er dagens foreløpige tall basert på de målingene jeg har sett til nå.
Mest spennende i mitt prosjekt er jo detaljene, altså beregningen av partienes oppslutning i de enkelte fylkene i prosent og i antall stemmer, og dermed fordelingen av mandater. Her er det de lokale målingene som er viktigst. De lokale målingene er jo mer sporadiske, så det er lite fruktbart å regne noe glidende gjennomsnitt av dem i seg selv. I stedet beregner jeg avstanden mellom den lokale målingen og det nasjonale snittet som ligger i Kalendertabellen min den datoen den lokale målingen er publisert. Snittet av disse avvikene bruker jeg til å gjøre meg opp en mening om fylkets politiske særpreg, eller "fylkesfaktor". Også dette snittet er glidende, men tidvektingen er mer beskjeden, noe som gjenspeiler to antakelser: 1) at avviket fra nasjonalt snitt er en mer stabil størrelse enn partienes frem- og tilbakegang, og 2) at partienes varierende oppslutning over tid i fylkene henger nøye sammen med de samme bevegelsene nasjonalt. Prognosen for partienes oppslutning i fylkene endrer seg altså både etter nasjonale og lokale meningsmålinger
En vri til er at jeg i tillegg til denne prognosen, lager en justert prognose, der jeg tar hensyn til det FiveThiryEight kaller "House effect", og det er denne justerte prognosen jeg fester mest lit til. Det er nemlig slik at ulike meningsmålere erfaringsmessig har en tendens til å måle enkelte partier høyere eller lavere enn andre. Man kan spekulere i hva det kommer av, men jeg justerer de lokale målingene i samsvar med dette. Dette har vist seg å gi et mer enhetlig bilde av fylker man skulle tro ligner på hverandre. Så vil stortingsvalget vise om dette var et klokt metodevalg eller ei. De nasjonale målingene justerer jeg ikke, men nederst i oversikten over stemmetall fordelt på fylker, finnes en sum av lokale prognoser. Denne vil avvike noe fra snittet av nasjonale målinger.
På nettsiden har jeg derfor i tillegg til ujustert og justert nasjonal oversikt også oversikter over hvert enkelt fylke, med tidligere valgresultater, mandatberegning og endring i mandattallet, navnene på kandidatene med eventuell lenke til Wikipedia-artikkel, rangering i mandatfordelingen og utvalgte utslåtte kandidater, slik at man kan se hvor mye de mangler på å bli valgt. Mye nyttig informasjon med andre ord.
Jeg har tenkt til å bruke denne bloggen til å kommentere meningsmålinger og tendenser og annet som måtte falle meg inn, i stedet for å fylle Facebook-profilen med slikt. Det er jo for litt spesielt interesserte, dette. Så blir det jo spennnende å se hvor feil jeg tar til slutt.
Ole David Østli
Ingen kommentarer:
Legg inn en kommentar