“Hvor skal du bo?”-artikler overser vigtigt problem

Fra tid til anden dukker der artikler op som fx Tjek kortet over Danmark: Her bliver du 100 år eller Bopæl afgør risikoen for at udvikle sclerose. Her kan man blandt andet læse om, hvor man skal bo som 71-årig for at blive 100 år gammel eller hvor man helst ikke skal være født for at få sklerose.

Lad os kigge på et kort fra artiklen om at blive 100 år gammel.

Kortet illustrerer, hvor man skal bo som 71 årig for at blive 100 år gammel. Hold det kort i mente og kig nu på et kort fra artiklen om sklerose.

Når jeg ser på disse kort, så ser jeg nogle tyndt befolkede områder slå ud i den ene eller anden ekstrem. Morsø, Fanø og det midtjyske hvad angår om at blive 100 år eller ej. Og Nordvestjylland*, Midtjylland, og Lolland hvad angår sklerose. Tjek selv mod et kort over befolkning (link til det interaktive kort her).

Det kan i sig selv være en tilfældighed at tyndt befolkede områder her slår ud i den ene eller anden ekstrem, men det skyldes mere sandsynligt problemet med små populationer. Små populationer har større sandsynlighed for at havne i den ene eller anden ekstrem. Intuitiv kan man overbevise sig selv om dette ved at betragte to populationer. Den ene har en størrelse på to, fx mine forældre, der bor i midten af ingenting ca. 20 kilometer fra nærmeste lysregulering. Den anden population har en størrelse på 1 million, fx København. Lad os sige at min far bliver 100 år gammel. Fordi han er den ældste af mine forældre, vil den population han er med i bestå af 50 procent 100 årige. For at København skulle bestå af 50 procent 100 årige, skulle 500.000 mennesker være 100 år, hvor det kun krævede én person som 100 årig i mine forældres husstand at blive 100 år. Små populationer har større sandsynlighed for at ende i en af ekstremerne.

Hvis du har lyst til en mere teknisk forklaring, så prøv hos Guillaume A. Rousselet, der også skriver om Problems with small sample sizes**.

Det der er ærgerligt, er at artiklerne om at blive 100 år gammel og om sklerose ikke nævner denne udfordring med små populationer. Jeg kan kun håbe at de forskere, der står bag resultaterne, er opmærksomme på udfordringen. Hvis du er født på Langeland, så har du 37 procent højere chance for at blive 100 år ifølge Anne Vinkler Hansen, med-forfatter på analysen om de 100-årige:

Vi regner egentlig ikke med, at der er en eller anden form for De Vises Sten begravet i Langelands muld, og det er faktisk pointen med analysen. Det kan være, vi tager fejl – måske er der bare noget magisk ved Langeland.

Jep, så magisk at kun få gider bo der. Hvilket er problemet. Sandsynligvis.

*Mere specifikt halvøen Thyholm hvor jeg selv tilbragte de første 20 år af mit liv og kendte to af de skleroseramte.

**Og vær nu forsigtig med at bruge fine landkort til at vise dine resultater

Kommentarer er velkomne på LinkedIn

Benfords lov – Kirketælling 2015 i Fyens Stift

Dette er del IV om Benfords lov. Se også del I for introduktion; del II om VisitDenmarks besøgstal for attraktioner; og del III om Trafik-, Bygge- og Boligstyrelsens passagertal på danske stationer.

Folkekirken indeholder et væld af informationer om især økonomi, men også en del om tal for antal besøgende i landets kirker – såkaldte kirketællinger. Oplysninger om kirketællinger sker fra hvert af de ti stifter, der er i den danske folkekirke. Offentliggjorte kirketællinger sker på forskelligt detaljeringsniveau fra stift til stift, hvor Fyens Stift har den mest deltaljeret opgørelse. Kirketælling i tal fra Fyens Stift opgøres på sogneniveau, mens de for de øvrige stifter er opgjort på provstiniveau svarende til kommuneniveau. Her ses et udsnit af kirketælling 2015 for Middelfart Provsti.

Jeg har samlet tal for alle sogne i Fyens Stift for kirkegængere ved højmesser, gudstjenester, søn- og helligdage i 2015. Det blev til i alt 240 observationer.

Bør tallene for antal kirkegængere følge Benfords lov? Umiddelbart ja, idet:

– Tallene må formodes være fortløbende fra første ankomne kirkegænger på bænken. Det vil sige, at den første efterfølges af den næste, som efterfølges af den tredje og så videre.
– Der er et maksimum for, hvor mange kirkegængere, der kan være på et år til højmesser, gudstjenester søn- og helligdage, men det har ingen praksis betydning i denne øvelse.

Men der er imidlertid er forhold, der taler imod:
– Antallet af observationer er mellem 200 og 300. Det er i den lave ende, af hvad der skal til, for at kunne vurdere, om talsættet følger Benfords lov.
– Omkring 40 procent af observationerne er kun på tre cifre, så fjerde ciffer må forventes ikke at følge Benford.

Lad os se på tallene:

Graf 1, p-værdi 78,38 procent

Graf 2, p-værdi 99,18 procent


Graf 3, p-værdi 80,33 procent

Graf 4, p-værdi 4,29 procent


Fine grafer og p-værdier med undtagelse af 4. ciffer, som forventet.

Jeg konkluderer, at den offentliggjorte kirketælling 2015 for Fyens Stift følger Benfords lov.

Full disclosure: Jeg var ansat i Kirkeministeriet i perioden 2007-2012 og har arbejdet for Kirkeministeriet som konsulent på diverse opgaver siden. Mens jeg var ansat, begyndte man at lave kirketællinger med ministeriets involvering, men uden at jeg var involveret i opgaven.

Kommentarer er velkomne på LinkedIn.

Benfords lov – Trafik-, Bygge- og Boligstyrelsens passagertal på danske togstationer

Dette er del III om Benfords lov. Se del I for introduktiondel II om VisitDenmarks besøgstal for attraktioner og del IV om antal kirkegængere i Fyens Stift.

Trafik-, Bygge- og Boligstyrelsen sendte i november 2017 Trafikplan for den statslige jernbane 2017-2032 i høring. Bilag 1 til trafikplanen indeholder tal for passagerudvikling pr. station for perioden 2015-2032 med forudsigelser for 2022, 2027 og 2032 for henholdvis hverdag og på årsbasis.

Tabel 1

For at begrænse mig, vil jeg se på talsættet for hverdag 2015 og for hverdag 2032. Så kan vi måske få en idé om, hvor gode Trafik-, Bygge- og Boligstyrelsen er til at tælle i dag, og hvor gode de er til at forudsige udviklingen frem mod 2032.

Bør tallene for passagerer følge Benfords lov? Umiddelbart ja, idet:

– Tallene må formodes være fortløbende fra første passager på stationen den dag. Det vil sige, at første passager efterfølges af den næste, som efterfølges af den tredje besøgende og så videre. Passagerer kan selvfølgelig ankomme samtidigt på stationen, men det ændrer ikke på, at tallene må være fortløbende.
– Der er i praksis ikke et maksimum for, hvor mange passager, en station kan have i løbet af en dag.

Men der er imidlertid er forhold, der taler imod:
– Tallene er afrundet til hele hundreder. Derfor formodes kun tal for første ciffer at følge Benfords lov.
– Antallet af observationer er på knap 300. Det er i den lave ende, af hvad der skal til, for at kunne vurdere, om talsættet følger Benfords lov.

Lad os se på tallene for 1. ciffer:

Graf 1, hverdag 2015, p-værdi 0,12 procent

Graf 2, hverdag 2032, p-værdi 4,2 procent

Der ses en nedadgående tendens for begge årstal, men p-værdierne indikerer, at talsættene ikke følger Benfords lov. Der er især udsving for tallet 5 for begge årstal.

Så hvad foregår der? Det er svært at sige. Trafik-, Bygge- og Boligstyrelse oplyser i trafikplanen, at passagertallene for 2015 tager udgangspunkt i en såkaldt observeret OD matrix. Det er en stationsmatrix for det statslige jernbanenet opstillet af Trafik-, Bygge- og Boligstyrelsen. OD-matricen omfatter ikke solorejser med metro, privatbaner eller SJ (svensk togselskab). OD-matricen repræsenterer den samlede rejse, men ved skift til metro eller privatbane er skiftestationen anvendt. Data vedrørende fjern- og regionalstrækninger er baseret på billetsalg samt modelberegninger for lokale rejser og frirejser. Data vedrørende S-banen samt Kyst- og Kastrupbanen er baseret på tællesystemer og briktællinger. OD-matricen for 2015 er symmetriceret.

Lad os se på, hvad en OD matrix er. OD står for Oprindelse Destination, det vil sige “til” og “fra”, og en matrix er til vores formål her en tabel med lige mange rækker og kolonner. En OD tabel viser, hvor mange passager, der rejser fra et sted til et andet sted. For eksempel, hvis vi har tre byer Andeby, Gåserød og Kalkunkøbing, så kan vi blandt andet rejse fra Andeby til Gåserød og vi kan rejse fra Andeby til Kalkunkøbing. Det er illustreret i Tabel 2:

Tabel 2

I eksemplet i Tabel 2 er der 160 personer, der rejser fra Andeby til Gåserød og 180 personer, der rejser fra Andeby til Kalkunkøbing.

Rejser kan også foregå fra Gåserød til Andeby og Kalkunkøbing, og de kan foregå fra Kalkunkøbing til Andeby og Gåserød. Dette er illustreret i Tabel 3 og Tabel 4.

Tabel 3

Tabel 4

De tre tabeller kan sammenstilles i én tabel. Dette er gjort med Tabel 5.

Tabel 5

Her antager vi, at der ikke er rejsende, der rejser fra en station til den samme station, fx fra Andeby til Andeby.

Vender vi tilbage til matematikken og kalder Tabel 5 for en matrix, ses det, at matricen ikke er symmetrisk. På matematisk er en symmetrisk matrix en matrix, som er sin egen transponeret (For en n x n matrix A, er AT=A). Det betyder, at tallene i den nederste halvdel skal være identiske med tallene i den øverste halvdel og på bestemte pladser i matricen. Det er de ikke her. En symmetrisk matrix med udgangspunkt i Tabel 5 kunne se ud som den, der er vist med Tabel 6.

Tabel 6

Her har jeg blot erstattet tallene i nederste halvdel af Tabel 5 med tallene i øverste halvdel af Tabel 5, således at “Fra Andeby Til Gåserød” er det samme som “Fra Gåserød til Andeby” og så videre for muligheder for byerne.

Det er næppe sådan Trafik-, Bygge- og Boligstyrelsen har gjort det eller har “symmetriceret” matricen, som de skriver. Men jeg ved det ikke, for de skriver ikke yderligere. Der er dog mange andre muligheder hvorpå en matrix kan gøres symmetrisk, hvis man vil.

Det vigtige her er, at processen med at gøre matricen symmetrisk er en potentiel kilde til at skubbe passagertallene længere væk fra den fordeling, som Benfords lov tilsiger.

OD-matricen er ikke det eneste, der er svært at gennemskue. Briktælling er en måde at undersøge passagers rejsemønstre, hvor der uddeles og indsamles brikker til og fra passagerer. Tællesystemer optræder i forskellige former. For S-tog tælles passagererne dels ved at veje toget, og dels ved at tællesensorer ved alle døre tæller de passagerer, der går ud og ind. I metroen tælles alle passagerer, når de går ind i metroen ved, at et målesystem registrerer varmen fra et menneske, når enheden passeres. Varmemålerne sidder over dørene på stationerne, så passageren tælles med, når vedkommende stiger på toget. Når Trafik-, Bygge- og Boligstyrelsen oplyser, at data vedrørende fjern- og regionalstrækninger er baseret på billetsalg samt modelberegninger for lokale rejser og frirejser, er det svært at gennemskue, og det lyder som endnu en potentiel kilde til at skubbe fordelingen af passagertal væk fra Benfords lov.

Der er noget i vejen et eller andet sted. Det kan være det lave antal observationer, men det virker voldsomt, at det skulle give disse afvigelser. Det kan også være den statistiske test, der ikke er stærk nok. Det er også sandsynligt, at der i metoden til at producere tallene er foretaget valg, der gør, at talsættet ikke følger Benfords lov bedre.

Under alle omstændigheder er det en anledning for Trafik-, Bygge- og Boligstyrelsen at eftertjekke sin model for mulige fejlkilder for passagertal for stationer og eventuelt gøre processen mere gennemskuelig. Tallene bør følge Benfords lov (bedre), og styrelsen vil givetvis kunne komme væsentlig tættere på en forklaring for afvigelsen, end den jeg er i stand til for nærværende.

Full disclosure: Jeg var ansat i Trafikstyrelsens sekretariat for Jernbanenævnet i perioden 2012-2015. Jeg havde ikke noget med passagertal på stationer at gøre.

Kommentarer er velkomne på LinkedIn.

Benfords lov – VisitDenmarks besøgstal for attraktioner

Dette er del II om Benfords lov. Se del I for introduktiondel III om Trafik-, Bygge- og Boligstyrelsens passagertal på danske stationer og del IV om antal kirkegængere i Fyens Stift.

VisitDenamrk har lavet en opgørelse over besøgstal for de 300 mest besøgte attraktioner i Danmark i 2016.

Bør talsættet for besøgstal følge Benfords lov? Umiddelbart ja, idet:

– Tallene må formodes være fortløbende fra første til sidste åbningsdag for attraktion. Det vil sige, at første besøgende efterfølges af den anden besøgende, som efterfølges af den tredje besøgende og så videre. Datasæt med fortløbende tal over et stort nok interval må generelt forventes at følge Benfords lov.
– Der er i praksis ikke et maksimum for, hvor mange besøgende, en attraktion kan have i løbet af et helt år, og i hvert fald ikke et maksimum, der er relevant at tage højde for her.

Men der er imidlertid er forhold, der taler imod:
– Kun de 300 mest besøgte attraktioner er taget med. Dermed vil der være en nedre grænse for antal besøgende. Dette kan have betydning.
– Antallet af observationer er på 300, det vil sige i den lave ende, af hvad der skal til for at kunne vurdere, om talsættet følger Benfords lov.

Lad os se på tallene. For de første fire cifferplaceringer ser graferne således ud:

Graf 1, p-værdi 0,41 procent

Graf 2, p-værdi 69,85 procent

Graf 3, p-værdi 65,97 procent

Graf 4, p-værdi 0,03 procent

Ser man på Graf 1, så ser det ikke helt skævt ud i forhold til Benfords lov. Der dog nogle udstikkere og p-værdien indikerer, at talsættet på første ciffer ikke følger Benfords lov. Det samme gør sig gældende for fjerde ciffer.

For andet og trejde ciffer indikerer p-værdien, at talsættet følger Benfords lov. Så en blandet konklusion ved første gennemgang. Lad os se, om vi kan komme tættere på en forklaring.

Som nævnt er der en nedre grænse for antal besøgende, idet listen kun medtager de 300 mest besøgte attraktioner. Der er 47 observationer for besøgende i intervallet 1.000-9.999. Første observation i intervallet starter imidlertid på 6.185. Det vil sige, at der i dette interval ikke forekommer tallene 1, 2, 3, 4 og 5 som 1. ciffer. Disse tal vil således “mangle”, når man undersøger fordelingen i forhold til Benfords lov. Dette kan være med til at forklare, hvorfor vi i Graf 1 ser færre 2’er, 3’er, 4’er og 5’er som første ciffer.

På lignende vis er der i der i toppen af listen blot fire observationer i for besøgende i intervallet 1.000.000-9.999.999. Her vil der således også være “mangler”.

Fjernes observationerne i de to nævnte intervaller og køres testen igen, ser graferne således ud:

Graf 1, p-værdi 1,95


Graf 2, p-værdi 44,13 procent

Graf 3, p-værdi 55,25 procent

Graf 4, p-værdi 0,12 procent

Nu ser det visuelt bedre ud på 1. ciffer og p-værdien har rykket sig anelse. For de øvrige cifferplaceringer er der imidlertid ikke meget forbedring at spore, og det kan skyldes det forhold, at vi nu har reduceret antal observationer i et i forvejen sparsomt talset.

Jeg har ikke flere undersøgelser at foretage med dette talsæt pt. Ud fra ovenstående konkluderer jeg, at VisitDanmarks opgørelse over besøgstal for de 300 mest besøgte attraktioner i Danmark i 2016 følger Benfords lov til en vis grad, og at flere observationer, fx en top 500 sandsynligvis vil bringe talsættet tættere på Benford-fordelingen.

Kommentarer er velkomne på LinkedIn.

Introduktion til Benfords lov

Dette er del I om Benfords lov. Se også del II om VisitDenmarks besøgstal for attraktionerdel III om Trafik-, Bygge- og Boligstyrelsens passagertal på danske stationer og del IV om antal kirkegængere i Fyens Stift

Jeg har længe været fascineret af Benfords lov, også kaldet lov om første ciffer. Det er ikke en lov i fysikkens eller juraens verden, men en statistisk sammenhæng, der ses i talsæt på mange forskellige områder.

I talsæt der adlyder loven, vises tallet 1 som det ciffer, der forekommer oftest omkring 30 procent af tiden, mens 9 fremstår som det tal, der forekommer færrest gange, mindre end 5% af tiden. Det vil sige, at tallene for første ciffer ikke er ligeligt fordelt med omkring 11,1% af tiden for hvert tal. Benfords lov giver også forudsigelser om fordelingen på 2., 3. ciffer og så videre. Jo længere man når hen i cifferrækken, jo mere ligeligt bliver fordelingen. Således er fordelingen på 2. ciffer knap så skævt som på 1. ciffer, mens fordelingen på 4. ciffer er så godt som ligeligt.

Benfords lov gælder for en lang række forskellige talsæt, som fx elregninger, aktiekurser, huspriser, befolkningstal, og matematiske talrækker.

Det er jo meget bekvemt, men hvad kan det bruges til? Hal Varian, der er tekstbogsforfatter i mikroøkonomi og cheføkonom hos Google, foreslog i 1970’erne, at Benfords lov kunne bruges til at finde svindel i regnskabstal. Forudsætningen er, at folk der snyder med regnskabstal ikke vil finde på tal, der følger Benfords lov. Det viser sig, at folk der snyder, i højere grad bruger 5 og 6 som 1. ciffer, som om disse tal var mere tilfældige og dermed mere legitime. Derfor vil 5 og 6 optræde oftere i talsættet, end de burde, hvis talsættet ikke havde været manipuleret. I den forbindelse kan det nævnes, at de nationaløkonomiske data, som den græske regering rapporterede til EU, før de kom ind i euroområdet ikke stemte overens med Benfords lov.

Benfords lov kan derfor benyttes som et værktøj til kvalitetssikring af talsæt. Værktøjet har dog sine begrænsninger. For det første er det ikke egnet til alle typer talsæt, idet ikke alle talsæt bør stemme overens med Benfords lov. Eksempler på talsæt, som ikke forventes at stemme overens med Benfords lov inkluderer:

Antal passager fly
Telefonnumre
Datasæt med 200 eller færre transaktioner
Data genereret af formler (fx YYMM #### som i et forsikringsnummer)
I det hele taget data som er begrænset af et maksimums- eller minimumsnummer, fx en timeløn eller voksne personerne højde.

En anden væsentlig begrænsning er, at selv om talsættet stemmer overens med Benfords lov, siger det ikke noget om, hvorvidt talsættet er korrekt. Talsættet kan være manipuleret og stadig følge Benfords lov enten tilfældigt eller ved at være manipuleret til det.

Benfords lov bør ses som en første afprøvning af talsættet. Hvis det stemmer overens med Benfords lov, og man stadig har mistro til talsættets validitet, bør man søge andre muligheder for at undersøge nærmere. Hvis ikke talsættet følger Benfords lov, og man ellers har tiltro til tallene, kan man også undersøge nærmere og nogle gange igen ved hjælp af Benfords lov.

Hobby-matematikeren kan tælle antal af cifre på de forskellige pladser i talsættet, stille dem op grafisk, og så afgøre med sig selv om man synes det stemmer overens med Benfords lov.

Bliver man en smule mere teknisk, opstilles en nulhypotese, hvor det antages, at talsættet følger Benfords lov. Så køres en χ2-test, der spytter en p-værdi ud. P-værdien er groft sagt sandsynligheden for at simulere et udfald, der er mindst lige så skævt som det observerede udfald, idet simuleringen altid tager udgangspunkt i nulhypotesen. Det vil sige, en p-værdi på under 5% resulterer i en forkastelse af nulhypotesen, hvis man arbejder med et signifikansniveau på 5%.

Længere nede i kaninhullet for statistiske værktøjer findes metoder som Kolmogorov–Smirnov test og Kuiper’s test. Personligt foretrækker jeg en χ2-test krydret med noget hobby-matematik og sund skepsis.

Alt sammen kan være sjovt at læse om, med hvad med at prøve det af? Følgende figurer illustrerer fordelingen af 1. ciffer for 2.085 aktiekurser ved lukketid den 4. maj 2018 på de amerikanske børser.

Voilà. P-værdi på 96,67 procent.

Jeg vil demonstrere Benfords lov på udvalgte talsæt i kommende indlæg. Det er talsæt, der så vidt jeg ved, ikke tidligere har været undersøgt på denne måde. I del II undersøger jeg, om VisitDenmarks opgørelse af besøgstal for de 300 mest besøgte attraktioner stemmer overens med Benfords lov. I del III drejer det sig om Trafik-, Bygge- og Boligstyrelsens tal for passager på danske togstationer og styrelsens forudsigelser for disse tal i frem mod 2032. Del IV beskæftiger sig med tal for besøgende i kirker på Fyn.

Benfords lov er et stort emne i videnskabelig litteratur, og der sker en del forskning omkring den. Jeg har ikke engang skrabet overfladen i dette indlæg. Hvis du vil vide mere om Benfords lov, kan jeg anbefale følgende, som også er kilder til dette indlæg:

Wikipedia
Benford Online Bibliography
Testing Benford’s Law
I’ve Got Your Number af fraud detector Mark Nigrini
Understanding and Applying Benford’s Law

Happy googling.

Kommentarer er velkomne på LinkedIn.

Jordemødre foretager ikke obduktioner

Om lægers aversion mod tal.

Hvorfor er læger mindre tilbøjelig til at udnytte teknologi som fx data i deres praksis end personer i andre professioner er det? Det har stået på læææææænge. Lægen Ignaz Semmelweis brugte i 1800-tallet mange kræfter på at overbevise sine kollegaer, at når de havde foretaget en obduktion, skulle de vaske deres hænder, inden de undersøgte gravide kvinder. Semmelweis havde set en sammenhæng i det observeret data, nemlig at gravide, der var blevet tilset af læger, havde højere forekomst af barselsfeber end gravide, der var blevet tilset af jordemødre.

Det virker banalt i dag, men ikke den gang. Hans indsats virkede, men blev mødt med stor modstand fra hans kollegaer.

Joseph Britto, tidligere læge på intensiv kommer med et bud på mange lægers aversion mod ny teknologi. Her citeret fra Super Crunchers af Ian Ayres:

“When Britto started learning how to fly an airplane back in 1999, he was struck by how much easier it was for pilots to accept flight support software.

“I asked my flight instructor what he thought accounted for the difference,” Britto said.

“He told me, ‘It is very simple, Joseph. Unlike pilots, doctors don’t go down with their planes’.”

Kommentarer er velkomne på LinkedIn.

Spilteori i mobilabonnementer

[Offentliggjort første gang på LinkedIn den 23. marts 2018]

Jeg holder lige så meget af David Hasselhoff som de fleste, men der var noget ved 3’s reklame for deres produkt 3Deling, jeg ikke kunne slippe.

3Deling går ud på, at i stedet for hver måned at betale for meget for data, der ikke bliver brugt eller betale ekstra for at toppe data op, så får 3’s kunder muligheden for at vælge den samlede datamængde, der passer til familiens behov og så blot supplere med det antal tale- og dataabonnementer, de har brug for.

Da reklamerne kørte i efteråret 2017, arbejdede Rambøll og Carve på en opgave for Kirkeministeriet. Her argumenterede vi ud fra spilteori (se side 61-64), at folkekirkens stifter har et incitament til at merforbruge på præsteløn grundet solidarisk overførsel af midler. Den dominerede strategi for et stift er at merforbruge på sin egen bevilling. Det sker fordi merforbrug hos ét stift kan imødekommes ved et mindreforbrug hos et andet stift, så længe den samlede bevilling for alle stifter overholdes.

Det virker som om, det er samme incitament, der er til stede, hvis en familie vælger 3Deling. Før skulle hvert enkelt familiemedlem sørge for at optimere sit dataforbrug op til maksimum, men havde et incitament for ikke at skulle gå over sit datamax, fordi det koster ekstra. Med 3Deling mindskes incitamentet for hvert familiemedlem til at overholde et individuelt maksimum, for nu er der kun er ét samlet maksimum for hele familien. Og dermed incitament til at overforbruge samlet set. Hvilket igen koster enten ved at betale ekstra for at toppe data op, eller ved at købe sig til højere maksimum.

Jeg siger ikke, at det var intentionen fra 3’s side at forsøge dette spilteoretiske produkt, men smart er det. Især hvis familierne agerer på incitamentet og lægger flere penge hos 3 end før.

Hvor har jeg lyst til at grave i 3’s data. Bruger husstandene mere eller mindre data ved 3Deling? Er 3’s omsætning ændret som konsekvens af 3Deling? Mange gode spørgsmål, der er værd at undersøge.

Kommentarer er velkomne på LinkedIn.

Nettos opgørelsesmetoder for reduktion af madspild

Indledning

Netto gik i 2017 til kamp mod madspild, hvor de udtrykte et mål om at halvere deres madspild inden 2030. Det kan kun være en god idé at minimere spild og tak til Netto for at sætte yderligere fokus på dette. Deres eksisterende metode til at opgøre madspild kan imidlertid over tid vanskeliggøre en meningsfuld opgørelse af madspild og ret markant devaluere Nettos indsats mod madspild. Og det vil da være ærgerligt.

Netto offentliggjorde i starten af 2018 tal for madspild i deres butikker, og viste, at der var sket en reduktion i madspild i 2017.

Netto startede med at offentliggøre deres tal i 2017, hvor Netto lancerede et mål om at halvere sit madspild inden 2030.

Nettos metode til opgørelse af madspild

Jeg har ikke kunne finde ud af, hvordan Netto opgør deres madspild. Noget tyder på, at de benytter Miljøstyrelsens definition til opgørelse. Miljøstyrelsens definition lyder:

Madspild er fødevarer, der kunne være spist, men i stedet er blevet smidt ud.

Netto leverer følgende graf over deres madspild:

Kilde: Netto

Som det kan ses, var Nettos madspild i 2016 på 17.632 ton, mens deres madspild i 2017 var på 17.121. Den skarpe læser vil bemærke, at der er et tal med en mindre skriftstørrelse under de 17.121 for 2017. Netto skriver selv følgende om 2017:

“Med samme antal butikker som i 2016, er Nettos madspild 17.121 tons. I 2017 fik vi 38 nye butikker, og derfor er det samlede madspild 17.635 tons.”

Hvis du er med mig hertil, kan du måske også se, at dette ikke er det mest elegante eksempel på formidling af data. De prøver at sige, at det faktiske madspild i 2017 var på 17.635 tons, dvs. en lille stigning siden 2016 pga. flere butikker. Hvis man derimod antog det samme antal butikker i 2017, som i 2016, så havde madspildet været 17.121 tons (ca. 3 % mindre).

Det inviterer en række overvejelser og spørgsmål. Hold fast.

Er en Netto-butik en homogen størrelse? I min – indrømmet – begrænset erfaring er Netto-butikker ikke en homogen størrelse. De varierer i størrelse, udvalg, åbningstider og selvfølgelig beliggenhed. Dermed varierer de også i antal kunder og omsætning. Når de varierer i udvalg, er der en sandsynlighed for, at de også varierer i andel af madspild. En meningsfuld sammenligning baseret på “samme antal butikker som i 2016” bør i 2017 således ske med udgangspunkt i nøjagtig de samme butikker, som i 2016.

Men vent lidt.

Netto-butikker holder ikke evigt. Og måske udvider nogle butikker, mens andre bliver mindre. Helt sikkert er det, at nogle butikker på en given beliggenhed lukker enten permanent eller midlertidigt. Dette tager Netto måske højde for i deres beregninger. Det fremgår bare ikke.

Hvad sker der frem mod 2030? Hvis det er meningen, at Netto skal halvere sit madspild inden 2030, må der være et basisår at tage udgangspunkt i. Dette er antageligt 2016 (selvom grafen også viser madspildet tilbage i 2014), da deres kamp mod madspild startede her. Men Netto åbnede i 2017 38 nye butikker, og for Nettos skyld håber jeg, at denne udvikling fortsætter. Men tager man i 2030 udgangspunkt i butikkerne, der også eksisterede i 2016, så står man tilbage med en masse butikker, der ikke er med i statistikken og dermed et svagt tal for en forhåbentlig reduktion i madspild.

Om andre metoder for opgørelse af reduktion

Det er dog svært at finde en egnet metode, og der er derfor intet at sige til, at Netto har sine udfordringer. Dette er et velkendt problem på flere områder, fx ved beregninger af reduktion af CO2 udledninger for en given sektor. Her vil man for madspild kunne finde inspiration til opgørelsesmetoder.

En metode er at benytte den struktur i sektoren, der er i basisåret for de fremtidige år, som Netto lader til at gøre. Fordelen er, at strukturen er forholdsvis nem at opgøre, fx i antal butikker. Ulempen er, at strukturen i sektoren ændrer sig over tid, og sammenligningsgrundlaget mellem basisår og de kommende år derfor flytter sig fra hinanden. Antal Netto-butikker er et relevant tal for struktur, men ikke det eneste relevante tal at se på. I stedet for antal butikker, kunne man også benytte omsætning eller indtjening som et tal for strukturen.

Endnu en måde at opgøre på er, ved at se på det absolutte tal for madspild for hvert år og sætte det i relation til et eller flere andre nøgletal, som fx omsætning, indtjening og/eller antal butikker.

Eller man kunne gå alternative veje, og få inspiration fra et helt andet område – fx finanssektoren. Med Nettos målsætning, har vi et mål om halvering af en størrelse over tid, der bliver ved med at ændre sig over samme tid. Så hvilke redskaber, kan Netto og andre tage i brug? For mig minder udfordringen om et lignende problem, der findes i investering. Lad os kigge på noget finansieringsteori.

I finansiering er man interesseret i at vide, hvor stor gevinst eller tab man har på sine investeringer. Hvis en investor fx køber én aktie og kun den ene, er det simpel procentregning at opgøre gevinst/tab over tid. Men hvis investoren, som har et mål om et afkast på 50 % på sin portefølje over ti år, løbende tilføjer til sin portefølje med nye midler eller sælger ud af dele af sin portefølje, hvordan beregnes afkastet så? Lidt ligesom Netto tilføjer til sin portefølje (nye butikker og med medfølgende madspild) og/eller sælger fra sin portefølje (lukker butikker med medfølgende reduktion i madspild), hvordan beregnes den samlede reduktion i madspild så?

Der er udviklet diverse metoder til beregning af, om investoren nåede sit mål, og har man lidt tid til overs (det har jeg), kan man tilrette metoderne til at opgøre reduktion i madspild over tid.

Én metode er den simple Dietz metode, der lyder:

R=(B-A-C)/(A+C/2), hvor

R er porteføljens afkast

A er markedsværdien ved start

B er markedsværdien ved slut

C er netto (lille n) ekstern tilføjelse af midler i perioden. Når noget går ud af porteføljen, er negativt; når det går ind i porteføljen, er det positivt.

Det antages, at alle bevægelser ind og ud af porteføljen sker halvvejs i den givne periode eller er spredt ensartet over perioden, så bevægelserne i gennemsnit sker i midten af perioden.

Hvad med Nettos madspild i 2030?

Hvis ovenstående metode skulle oversættes til madspild, er det mest simple at gøre A og B til værdien af madspild. Hver gang en Netto-butik åbner, tilføjer den en bestemt størrelse af madspild. Hver gang en Netto-butik lukker, fratrækkes en bestemt størrelse af madspild. Denne størrelse værdisættes og så er vi klar. Modsat investoren så er vores mål nu, at R skal falde i stedet for at stige. Enheden for madspild kunne være ton eller kroner eller noget tredje.

Lad os tage et regneeksempel for enheden ton. Netto sagde i 2017, at tre butikker i Aarhus, København og Odense smider 5,5 ton frugt og grønt ud hver måned. Hvis frugt og grønt er sådan Netto opgør madspild (hvad med kød-, korn- og drikkevarer?), kan vi ud fra disse tal opgøre madspild for en Netto-butik. Og ja, i dette eksempel er jeg så nødt til at antage, at en Netto-butik er en homogen størrelse. Det svarer til, at en Netto-butik tilføjer et madspild på 22 ton om året.

Hvis jeg ikke tog højde for det, ville min beregning antage, at hver gang en Netto-butik åbner, vil den tilføje et madspild på 22 ton om året. Med andre ord ville det antages, at en ny Netto-butik i fx 2029 tilføjer samme madspild som en ny Netto-butik i 2018. Det bliver forhåbentlig ikke tilfældet. For at tage højde for det, reducerer jeg tallet for madspild med 3 procent om året. Det er ca. den reduktion, Netto selv rapporterer fra 2016 til 2017.

Jeg antager yderligere, at Netto åbner 38 butikker om året og at de ikke lukker nogle butikker frem mod 2030.

Så kan vi gå i gang med at finde følgende:

R: Den procent vi vil reducere madspildet med i 2030 i forhold til 2016. Her er den -50 procent.

A: Madspild opgjort i ton ultimo 2016/primo 2017. Her er det 17.632 ton.

B: Madspild opgjort i ton ultimo 2030. Denne skal beregnes.

C er netto tilføjelse af madspild i perioden. Denne skal beregnes.

C beregnes ved gange 38 med 22 ton for perioden 2017-2030, hvor antal ton pr. tilføjet butik reduceres med 3 procent, for hvert år vi går hen i perioden, startende i 2017. Således beregnes, at hver Netto-butik i 2030 tilføjer 14,4 ton madspild eller 545,8 ton for 38 nye butikker i 2030. Det samlede tal for C bliver 9.384,1 ton.

Nu mangler vi bare B. Denne finder vi ved at isolere B i formlen. Det bliver til:

B=R*A+(R*C/2)+A+C

Sættes tallene for R, A og C ind fås B=15.854,1. Givet de forudgående antagelser og forudsætninger skal Nettos samlede madspild i 2030 være på 15.854,1 ton, for at Netto kan sige, at de har reduceret madspildet med 50 procent.

Udfordringer ved finansieringsmetoden

Denne oversættelse af den simple Dietz metode til madspild kan også gøres for mere avancerede opgørelsesmetoder for afkast. Således vil man kunne kvalificere flere af antagelserne og forudsætningerne, ligesom Netto vil kunne kvalificere vækst i antal butikker. Men det bliver aldrig perfekt og oversættelsen har sine egne udfordringer, der skal tages hånd om. Ton (eller kroner) er ikke nødvendigvis det bedste mål for madspild. Man risikerer bogstavelig talt at sammenligne æbler og pærer. Så det bør undersøges nærmere, om en sådan metode giver mening. Men har man først en god metode til at finde en enhed for madspild, så kunne man overveje at prøve én af modellerne fra finansieringsteori.

Der kan også bruges de andre, mere simple metoder, men så håber jeg, at Netto sikrer sig åbenhed omkring forudsætningerne, så man ikke løber risikoen for at stå med tal i 2030, der kan angribes fagligt på den ene eller anden måde.

I sidste ende må det komme an på en prøve, hvad der virker bedst. Avancerede metoder er måske mere nøjagtige, men til gengæld sværere at formidle. Og kan man ikke forklare sine tal, kan man ikke forsvare dem. Set med kommunikationsbriller kan en simplere metode være at foretrække.

Det måske nemmeste ud fra opgørelsesmetode vil være et mål om helt at eliminere madspild, som Tesco og Migros forsøger. Tesco er i øvrigt et godt eksempel på en kæde, der er meget åben og detaljeret omkring, hvordan de opgør deres data for madspild.

Konklusion

Netto kan med fordel overveje at være endnu mere åben omkring, hvilken metode de benytter til opgørelse af reduktion af madspild over tid, og være konsistent omkring metoden, hvis ikke de allerede er det. Ønskes en anden metode, kan der hentes hjælp og inspiration fra supermarkedskæder i andre lande samt andre områder som fx klima og finansieringsteori.

Kommentarer er velkomne på LinkedIn.