Hjem > . > ST 53/12: Statistikk uten sikkerhetsnett

ST 53/12: Statistikk uten sikkerhetsnett

Kunnskapsbasert praksis startet som en reform innenfor den medisinske profesjon.

Målet var å gi bedre behandling gjennom standardisering av tiltak og  metoder. KBP – eller evidence-based medicine – innebar at behandlingen skulle i størst mulig grad  bygge på dokumenterte resultater fra medisinsk forskning.

KBP har bidratt til tette bånd mellom forskere og praktikere. I Norge er koplingen satt i system gjennom Nasjonalt kunnskapssenter for helsetjenesten.

De medisinske systemene for rapportering og statistisk analyse av hva som skjer i Helse-Norge blir stadig mer omfattende. Et aktuelt eksempel er denne nyheten:

  • Fra 1. juli 2012 er det Nasjonalt kunnskapssenter for helsetjenesten som skal motta meldinger om uønskede pasienthendelser i spesialisthelsetjenesten.

KBP har også negative sider. Rapportering tar mye tid. Leger, sykepleiere og andre ansatte kan få mindre rom for sitt eget skjønn. Muligheten for styring, kontroll og kritikk ovenfra øker.

Men mitt inntrykk er likevel at KBP har vært en betydelig suksess.  Store organisasjoner er ofte lukkede og konservative. KBP har bidratt til mer åpenhet og mer organisatorisk læring i Helse-Norge.

Lærende organisasjoner

Dagens bloggpost tar to ting for gitt

  1. At helsebibliotekarene spiller en viktig rolle innenfor kunnskapsbasert medisin og helsefag.
  2. At statistikken er et helt sentralt fagområde for all KBP

KBP er en reformbevegelse. Både personer og institusjoner som skal bruke KBP i sitt daglige arbeid må lære å jobbe på nye måter.

  • En lærende organisasjon – sier et nasjonalt pilotsykehus – er en organisasjon som utvikler, forvalter og tar i bruk sine kunnskapsressurser slik at virksomheten totalt sett blir i stand til å mestre daglige utfordringer og etablere ny praksis når det er nødvendig.

Lær statistikk

Da bør formidlingen av KBP bygger på de samme prinsippene.  Jeg oppdaget nettopp at Senter for kunnskapsbasert praksis, Høgskolen i Bergen (HiB), har laget en innføring i statistikk.

  • Her finner du lenker til sider som på en enkel måte og ved hjelp av konkrete eksempler gir en innføring i statistikk 

Innholdet er imidlertid ikke kvalitetssikret. Derfor melder jeg fra. Den første siden heter Beskrive tall. Her er noen eksempler:

Utvalg og tellinger

  • Utgangspunktet for statistisk beskrivelse og analyse er at man ved å se på et utvalg (de man undersøker) ønsker å si noe om en populasjon.
Dette er misvisende. Den offentlige statistikken bygger som oftest på fullstendige tellinger, ikke på utvalg. Mye medisinsk statistikk (som fødsel, dødelighet, innrapporterte sykdommer) bygger på slike tellinger.

Gjennomsnitt

Siden viser et histogram – som riktignok kalles Tabell (!) – med inntegnet normalkurve.

  • Bildet over viser alder i kategorier på fem år.
  • Hyppigheten (frekvensen) viser hvor mange som er i hver kategori, f.eks. er det 20 personer (40 %) i klassen 30-34 år. Gjennomsnittlig alder i denne gruppen er 32 år. 
Begge deler er feil.
  • Kategoriene har en bredde på 2,5 år (som forøvrig er svært uvanlig i demografisk statistikk)
  • Midtpunktet i intervallet 30-34 år er 32,5 år.
  • Gjennomsnittsalderen er 32,25 år (estimert under)

Estimat

Histogrammet viser at

  • 12 personer ligger i intervallet 30 til 32,49 år
  • 8 personer ligger i intervallet 32,5 til 34,99 år

Hvis vi antar jevn aldersfordeling innenfor hver celle, blir gjennomsnittsalderen:

  • (31,25 år * 12 + 33,75 år * 8)/20 = 32,25 år
 Diagrammet er forøvrig vanskelig å tolke siden hver celle i histogrammet omfatter 2,5 årskull.
Alderspyramider
  • Når vi måler alder på et stort antall mennesker vil resultatene fordele seg i en normalkurve.

Dette er grunnleggende feil. Det er nok å se på alderspyramiden til dagens norske befolkning.

Dersom vi lager et diagram for aldersfordelingen i en stasjonær befolkning – dvs. en befolkning (uten migrasjon) der fødselsrater og aldersspesifikke dødsrater har holdt seg konstant over lang tid – vil søylene åpenbart være høyest for de yngste aldersgruppene – og deretter bli lavere etter hvert som folk begynner å dø.

Skjeve fordelinger

  • I diagrammet under [Tabell 2] er fordelingen skjev (ikke normalfordelt) og da brukes vanligvis median som sentraltendensmål og spredningen vises med inter kvartil bredde (inter quartile range) eller prosentiler (percentiles). 
 Men diagrammet det vises til (til høyre)) angir hverken median, kvartildifferansen eller en eneste persentil. Det er fortsatt gjennomsnittet (mean) og standardavviket (Std.Dev) som blir oppgitt.
Noen av søylene er visuelt misvisende (svarer ikke til heltall). Dessuten står det – helt feilaktig – at antall observasjoner, N = 50  (!!).
Det er fornuftig å legge vekt på ordinalparametre som median, kvartiler og persentiler i skjeve fordelinger.  Om disse «vanligvis brukes» av medisinske forskere er jeg slett ikke sikker på. I samfunnsfag har jeg i hvert fall sett svært mange eksempler på bruk av gjennomsnitt, varians og standardavvik – med tilhørende statistiske tester –  også når fordelingene er klart asymmetriske.
Hva forteller spredningen?
  • Spredningen viser hvor stor variasjonen er i forhold til sentraltendensen.

Dette er misvisende. Spredning er ikke knyttet til sentraltendensen, men til variasjonen mellom de observerte verdiene.

Videoforelesning

Forelesningen om skalanivåer og parametre har også store svakheter. Noen eksempler:

  • Nominalskala forveksles med kategorisering av verdier.
  • Normalfordelingen skilles ikke fra andre symmetriske fordelinger (f.eks. den rektangulære)
  • Beskrivelsen av ordinal-, intervall- og ratioskala er misvisende.
    • Subjektiv opplevelse av smerte på en skala fra 0 til 100 beskrives f.eks. som en intervallskala*
    • Variable på rationivå blandes sammen med kontinuerlige variable**

*Hadde dette virkelig vært en intervallskala, kunne vi sagt at avstanden mellom smertenivåene 0 og 20 er den samme som avstanden mellom 60 og 80 – og dobbelt så stor som avstanden mellom 70 og 80.

**Antall personer i en husstand er en ratiovariabel uten å være kontinuerlig

Her bør det ryddes opp …

De neste sidene

De to neste sidene, om å analysere tall, er , vil jeg tro, omtrent uleselige for de som ikke på forhånd kan mye medisinsk statistikk. De er i hvert fall unødig krøkkete skrevet.
Men les og vurder selv. Fungerer disse sidene etter hensikten? Hvis ikke, bør de forbedres.
De to siste sidene (Formidle tall, Meta-analyse) er langt bedre. Det samme gjelder de tilhørende videoene.
Veien videre
Jeg må føye til at selve arbeidet som gjøres ved kunnskapssenteret åpenbart er av stor verdi for helsefagene – og at senteret kan tjene som modell for faglig utviklingsarbeid i andre profesjonsfelt. Nettstedet inneholder mange interessante og tankevekkende ressurser om (det vanskelige) forholdet mellom forskning, undervisning og praksis. Holdningen er dialogorientert, ikke dogmatisk.
Ressurser

Plinius

VEDLEGG

Fra Analysere tall 1:

I de første kolonnene i tabell 2 er tallene fra tabell 1 presentert som prosent.

  • En vanlig måte å analysere tallene er å se på forskjell i ”risikoen” for å bli bedre hvis du får massasje, sammenlignet med om du får en informasjonsbrosjyre. 
  • Risikoforskjellen mellom de to gruppene kan tallfestes, og er et punktestimat.
  • Rundt effektestimatberegner vi et konfidensintervall som viser i hvilket intervall vi med sikkerhet kan si at effektestimatet ligger hvis vi skal anvende den i utgangspopulasjonen.
  • Det er vanlig å oppgi CI med 95 % sikkerhet (95 % CI).

At teksten ikke er korrekturlest, får meg også til å stusse …

  • Hvis du lurer på hvor mange nordmenn som er motstandere av røykeloven KOMMA kan du gjøre en spørreundersøkelse.
  • Hvis du lurer på om det en ER noen vits i å slutte å røyke KOMMA kan du sammenligne levetid blant røykere og ikke-røykere.
  • Hvis du lurer på om nikotintyggegummi bidrar til enklere røykeavvenning KOMMA finner du svaret i randomiserte kontrollert E studier.
  • Hvilken fremgangsmåte du bruker for å finne svar vil variere, men uansett spørsmål vil svaret nesten alltid være knyttet opp mot et T eller flere tall
Kategorier:.
  1. 2012-09-28, kl. 13:06

    Nasjonalt kunnskapssenter for helsetjenesten og Høgskolen i Bergen har sammen utarbeidet kunnskapsbasertpraksis.no for helsepersonell for å bidra til økt bruk av forskning i praksis.

    Vi vil gi brukere med begrensede statistikkunnskaper en enkel innføring i begrep som er nødvendig for å forstå helsefaglig forskning. Den utakknemlige delen med enhver forenkling er at nyanser forsvinner, men den sjansen er vi villige til å ta i håp å nå frem hos dem som grøsser hver gang de leser ordet statistikk.

    Videre ønsker vi primært å formidle statistikk tilpasset forskning om effektspørsmål. I det perspektivet er utgangspunktet for statistiske beskrivelser og analyser et ønske om å si noe om en større populasjon basert på et utvalg. I det perspektivet spiller det liten rolle om et histogram benevnes histogram, tabell eller figur. I det perspektivet har vi oppnådd vår målsetting hvis leserne kjenner til begrep som normalfordeling, gjennomsnitt og standardavvik, og samtidig er inneforstått med at gjennomsnittet ikke alltid er til å stole på.

    Vi setter pris på konstruktive tilbakemeldinger og får som regel innspill direkte. Dine forslag for å bedre lesbarheten tar vi selvfølgelig med i det videre utviklingsarbeidet.

    Eva Denison, Kjetil G Brurberg og Lillebeth Larun

  2. 2012-09-29, kl. 21:22

    Hei og takk for svar.

    Jeg aksepterer selvsagt at mange nyanser forsvinner når man forenkler. Men jeg tror likevel det er fornuftig å skille mellom tabeller på den ene siden og diagrammer på den andre helt fra starten av. Dette er stoff som alle norske elever har møtt i sin skoletid.

    Wikipedia sier det slik:

    Tabell er ein oversiktleg presentasjon av fakta, ofte delt inn i rader og kolonnar, og ofte med tittelradar. Vanlegvis består tabellar av skildrande fakta som kan uttrykkjast i tal, men òg tekst.
    Diagram er en skjematisk tegning eller grafisk fremstilling av informasjon, som for eksempel sammenhengen mellom ulike mengder og variabler.

    Innføringen av begrepet statistikk fungerer greit:

    Statistikk beskriver og analyser[er] et fenomen ved hjelp av tall. Tallene kan beskrive hvor mange (er syke), hvor ofte (opptrer symptomer) og hvor mye (alvorlighetsgrad). Denne delen gir innblikk i hvordan dette ofte beskrives i artikler slik at du kan forstå hva tallene står for.

    Men jeg synes nok den første siden presenterer mange, og til dels krevende, begreper og forkortelser på svært kort tid:

    • agenor
    • ageskewed
    • befolkning
    • diagram
    • fordeling
    • gjennomsnitt
    • histogram
    • hyppighet (frekvens)
    • interkvartilbredde (inter quartile range)
    • kontinuerlig variabel
    • Mean
    • N
    • normalfordeling
    • normalkurve
    • prosentiler (percentiles)
    • populasjon
    • sentraltendens
    • sentraltendensmål
    • skjev fordeling
    • spredning
    • standardavvik
    • Std.Dev.
    • tabell
    • utvalg (de man undersøker)
    • variasjon

    Inter-quartile range, som kalles kvartilbredde på norsk, bør defineres. Både Wikipedia og NDLA har enkle og greie definisjoner. Rene feil bør dessuten rettes. «Tabell 1» viser alder i kategorier på 2,5 år. Gjennomsnittlig alder i klassen 30-34 år er ikke 32 år. Kurven som er tegnet inn i «Tabell 2» er egnet til å forvirre. Vi har jo å gjøre med en J-formet, ikke en klokkeformet kurve.

    ***

    Samstat-bloggen er en blogg om statistikk for bibliotekarer, og bibliotekarene spiller en viktig rulle i kunnskapsbasert medisin og helsefag. Når jeg kommenterer på nettet, i tillegg til å sende e-post til kunnskapssenteret, er det for å bidra til en bredere forståelse av statistiske begreper i relevante fagmiljøer. Fagdebatter bør generelt foregå i det offentlige rommet. Siden vi diskuterer en nettbasert innføring i statistisk metode for «engstelige nybegynnere», tror jeg det er lurt å vise at også lærere på dette området kan ha ulike synspunkter.

    Tord Høivik

  1. 2012-09-16, kl. 13:50

Legg igjen en kommentar

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut / Endre )

Twitter picture

Du kommenterer med bruk av din Twitter konto. Logg ut / Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut / Endre )

Google+ photo

Du kommenterer med bruk av din Google+ konto. Logg ut / Endre )

Kobler til %s

%d bloggers like this: