Dagbladet rangerer kommuner etter hvor mye de satser på skole. Skepsis og statistikk avslører at Dagbladets grunnlag for skåring og kåring er heller tynt.

DAgbladet og vitenskap: En interessant kombinasjon Dagbladets troverdighet når det gjelder å videreformidle ting som krever tenkning har vel aldri fått et så stygt skudd for baugen som da de kom med en sensasjonsopplysning om at nå er det bevist at mobilstråling er farlig, mens de lenket til en rapport, riktignok på engelsk, som sa det stikk motsatte. Nå i agurktida har Dagbladet funnet på å drive vitenskap selv. De har laget en oversikt over skolekvalitet i kommunenen, og rangert kommunene etter sine egne kvalitetskriterier. Så er spørsmålet: I dette forsøket på å drive vitenskap, hvor godt lykkes de? Og kunne de spart seg for å plage den stakkars ordføreren i Hattfjelldal som Dagbladet mener er den dårligste skolekommunen i Norge?

Jo, Dagbladet lister opp alle kommunene i Norge etter skoleprestasjoner. Som kriterier bruker de dels skår på Nasjonale prøver, dels sin egen vekting av hvor mye ressurser kommunene bruker på skole (driftsutgifter, gjennomsnittlig gruppestørrelse, andel lærere med høyere utdanning, etc.). Jeg velger å kalle denne rangeringen for Dagbladet-skårer.

Her er tabellen: Beste skolekommune

Det første jeg stusser på, er dette: Hvordan vet de at disse faktorene faktisk spiller noen rolle for skoleprestasjoner? Det greieste må da være å se om det er sammenheng mellom Dagbladet-prestasjonene og prestasjonene på nasjonale prøver. Veldig enkelt spørsmål. Er det det?

Vel, ikke så enkelt. Vi må korrelere skår på Nasjonale prøver mot Dagbladets egne indikatorer. Og det er ikke så lett, fordi … Dagbladet har rangert kommunene etter plassering. 1, 2, 3, … ca 400. Både hva angår skår på Nasjonale prøver og Dagbladet-skårer. Da kan vi ikke være sikker på normalfordeling. Så vi bruker en metode å korrelere som ikke er den du er vant med – Pearsons r, det er den som er r i vitenskapelige rapporter – men Spearmans ρ, som ikke krever normalfordeling. Og hva finner vi?

ρ = 0.227

Jeg antar at leseren har en vag anelse om hva normalfordering er. Det meste som varierer i naturen er normalfordelt eller kan normalfordels, i den forstand at det varierer rundt et gjennomsnitt. Korrelasjoner er mellom -1 og 1. -1 betyr full negativ sammenheng – er den ene der, er helt sikkert ikke den andre der. 0 betyr ingen sammenheng – er den ende der, kan man ikke vite om den andre er der. 1 betyr full positiv sammenheng – er den ene der, er også den andre der.

Dagbladet-skåren – den totale altså – forklarer altså ρ2% ≈ 5.1% av variansen i resultatene på Nasjonale prøver. I utgangspunktet virker ikke dette helt som noe solid grunnlag for å plage en ordfører.

Men la oss nå se litt på tallene Dagbladet har brukt, og hvor langt det er mulig å komme med dem. Og håpe, kanskje, at noen i Dagbladet leser dette og skjønner at det er ikke så enkelt som å bare slå masse tall sammen dersom man vil vite et eller annet. Alle snakker om Mark Twain som fortalte oss at det finnes tre slags løgn: Lies, damn lies and statistics, men det har skjedd ting med statistikk siden 1885, og det er nettopp slik statistikk ble brukt på Mark Twains tid (enkel tabulering av data) Dagbladet har brukt tallene sine.

Noe av det rare Dagbladet har gjort, f.eks., er å liste rådata. Det første problemet er at dataene ikke er tilrettelagt for å behandles statistisk. Det går mye informasjon bort når de to kriteriene – skår på Nasjonale prøver og Dagbladet-poeng – bare er rangert etter plassering. Vi vet ikke hvor stor forskjellen er mellom 1., 2., 3., … 404. plass. Så Det er det første det er lurt å se på.

Skårene på Nasjonale prøver er enklest, sånn sett. Dagbladet har listet opp skårer for matte, norsk og engelsk for alle kommunene. Så det er bare å bruke dem, eller rettere, snittet av dem. Tallene er her: Nasjonale Prøver, og de er normalfordelt. De kan altså brukes direkte. Korrelasjonen mellom gjennomsnittlig skår på nasjonale prøver og Dagbladets rangering er 0.981. Lite informasjon er altså gått tapt i Dagbladets måte å rangere på, men vi kan trygt bruke gjennomsnittlig skår på Nasjonale prøver fra Dagbladets tabell.

Her er Dagbaldets tabell over de faktorene som Dagbladet mener indikerer god skolesatsing: Ressurser, resultater og mobbing.

Utvalgsstørrelse (N), gjennomsnitt og standardavvik for Dagbladets indikatorer på skolesatsing
N Gjennomsnitt Standardavvik
Gjennomsnittlige grunnskolepoeng 384 39.774 1.8370
Andel elever med direkte overgang fra grunnskole til videregående opplæring 384 97.330 2.9112
Andel lærere med universitets- /høgskoleutdanning og pedagogisk utdanning 384 86.378 6.4567
Driftsutgifter, undervisnings-materiell per elev 384 1829.12 563.915
Gjennomsnittlig gruppestørrelse, 1.-10. trinn 384 12.026 2.3127
Mobbing, 7. og 10. trinn (skala 1-5) 384 1.4507 .15475
Folketall 384 12439.53 36893.477

 

Dette sier ikke så himla mye. Det som er viktig å vite, er hvor stor variasjonen er. Hvis variasjonen er lav, er det et dårlig mål på forskjeller. Det er store forskjeller som har betydning dersom man skal sammeligne. Men fra hofta: Snittet i Andel elever med direkte overgang fra grunnskole til videregående opplæring og Andel lærere med universitets- høgskoleutdanning og pedagogisk utdanning er omtrent det samme. Men spredningen (standardavviket) i Andel lærere med universitets- høgskoleutdanning og pedagogisk utdanning er mye større. Kan det tenkes at så mange lærere har det, at det ikke er noe stort poeng i å bruke det som noe mål? La oss f.eks se på korrelasjonen mellom hvert mål og skår på Nasjonale prøver:

 

Korrelasjoner, Nasjonale prøver mot Dagbladet-kriterier
r
Gjennomsnittlige grunnskolepoeng -.268**
Andel elever med direkte overgang fra grunnskole til videregående opplæring -.081
Andel lærere med universitets- /høgskoleutdanning og pedagogisk utdanning -.074
Driftsutgifter, undervisnings-materiell per elev -.036
Gjennomsnittlig gruppestørrelse, 1.-10. trinn .074
Mobbing, 7. og 10. trinn (skala 1-5) .067
Folketall -.120*
* 99% signifikant
* 95% signifikant

 

Dette sier vel ganske klart at målene Dagbladet har funnet fram til, ikke henger sammen med skår på Nasjonale prøver på noen fornuftig måte. Dette er jo spesielt. Det er bare grunnskolepoeng som har noen betydelig sammenheng (altså i størrelse), og sammenhengen er endatil negagiv. Kan vi ha gjort noe galt? Vel, la oss se først på korrelasjonen mellom Dagbladet rangering og Dagbladets måletall fra tabellen. Vi tar gjennomsnittet av de standardiserte skårene for Dagbladets måletall, og korrelerer dem med skårer på Nasjonale prøver. Da får vi se om Dagbladet er inne på noe i det hele tatt.

r= -0.188

Så, hvis vi bare korrelerer gjennomsnittlig Dagbladet-skår (normalfordelt gjennomsnitt av normalfordelte skårer), viser det seg at Dagbladets indikatorer predikerer dårligere enn ikkeno. Det virker jo snålt. Så vi prøver en regresjonsanalyse. Kan Dagbladets variable predikere skårer på Nasjonale prøver? Det ville jo alltid vært noe.

Regresjonsanalyse, Nasjonale prøver mot Dagbladet-kriterier
β 0.330
Gjennomsnittlige grunnskolepoeng -.270
Andel elever med direkte overgang fra grunnskole til videregående opplæring -.022
Andel lærere med universitets- /høgskoleutdanning og pedagogisk utdanning -.098
Driftsutgifter, undervisnings-materiell per elev .025
Gjennomsnittlig gruppestørrelse, 1.-10. trinn .078
Mobbing, 7. og 10. trinn (skala 1-5) .059
Folketall -.135*
* 99% signifikant
* 95% signifikant

Her er β korrelasjonen mellom predikatorene (altså Dagbladets antatte mål på skolesatsing i kommunen) og skår på Nasjonale prøver. Og mens hvert mål ser ut til å bidra lite (Ingen sammenheng mellom skoleresultater og mobbing, f.eks.), så har gjennomsnittlig gruppestørrelse litt å si (men altså bedre resultater hvis gruppene er store … og jo færre grunnskolepoeng, desto bedre. Det virker jo litt rart!

De store og små talls lov

Når Dagbladet gjør ei rangering som dette, så har de gjort noen forutsetninger. Blant disse forutsetningene er muligens at man ikke trenger noen teori for hvordan man velger ut variable: Man velger ut dem man synes bør spille en rolle, og rangerer ut fra dem. Det største problemet er naturligvis størrelsen de har aggregert på: De har sett på hver kommune. Hvis vi vil vite om variablene Dagbladet har valgt som indikatorer er gode, må vi se på skolenivå eller kanskje tilmed på klassenivå: Det kan være at det f.eks. er mange gode lærere i en kommune, men alle jobber i samme skole, fordi flinke folk søker sammen. Så det er én god skole og to dårlige. For eksempel. Det som virkelig roter det til, er jo de store kommunene med mange skoler. Så hva skjer om vi tar analysen på nytt og fjerner de største kommunene? Her er et forsøk hvor vi fjerner kommuner med innbyggertall over 2.7 standardavvik:

Regresjonsanalyse, Nasjonale prøver mot Dagbladet-kriterier
β 0.324
Gjennomsnittlige grunnskolepoeng -.268
Andel elever med direkte overgang fra grunnskole til videregående opplæring -.030
Andel lærere med universitets- /høgskoleutdanning og pedagogisk utdanning -.095
Driftsutgifter, undervisnings-materiell per elev .017
Gjennomsnittlig gruppestørrelse, 1.-10. trinn .130
Mobbing, 7. og 10. trinn (skala 1-5) .057
Folketall -.141*
* 99% signifikant
* 95% signifikant

Hva er det vi har gjort nå? Jo, den jobben Dagbladet burde ha gjort – laget en modell som kan brukes til å si noe om hva som faktisk må til for å få gode skårer på Nasjonale prøver. Det viser seg f.eks. at driftsutgifter ikke spiller noen rolle, mobbing er ikke interresant, lærernes utdannelse eller andel elever med direkte overgang fra grunnskole til videregående opplæring heller ikke. Gjennomsnittlig gruppestørrelse spiller en positiv rolle, og det er fint med lavt folketall. Det som virkelig er morsomt er gjennomsnittlige grunnskolepoeng.

Grunnskolepoeng regnes ut ved at alle avsluttende karakterer som føres på vitnemålet, legges sammen og deles på antall karakterer slik at en får et gjennomsnitt. Deretter ganges gjennomsnittet med 10. Enten de store kommunene er med eller ei, er korrelasjonen mellom grunnskolepoeng og skårer på Nasjonale Prøver i kommunen ikke lav, men negativ.

Det tyder på at karakterer, som mål på prestasjoner, i hvert fall i grunnskolen, er verre enn ikkeno.

Det burde slå den oppvakte leser, at hver gang det presenteres at en skole gjør det veldig bra eller veldig dårlig på på Nasjonale prøver, så er det en liten klasse. Dette kaller vi de små talls lov. De store kommunene samler seg på midten.

 

Skår på Nasjonale prøver mot folketall

PISA-skår mot folketall

Sånn er det her også, som figuren viser: De minste kommunene går ut til siden på begge sider, de største trekker seg mot midten. Dette skyldes ikke normalfordeling av data ute i verden. De små kommunene burde vektes pga. den relative størrelsen i forhold til de større.

Dagbladet kan alltid unnskylde seg med at de har andre, uavhengige kilder på at predikatorene de har brukt er viktige. Og det har de iofs rett i – kvaliteten på lærere skal være viktig. Men når f.eks. kvaliteten på lærere ikke får noen utslag i det hele tatt, er det tydelig at de ikke har valgt et mål på lærerkvalitet som faktisk måler lærerkvalitet. Det gjør rangeringen deres svært problematisk.

Så hva har vi?