Bild på Rebecka Jörnsten

Med big data i fokus

Som biostatistiker verkar hon i en miljö i ständig och snabb förändring.
Nyblivne forskningspristagaren Rebecka Jörnsten ser utmaningar med vår nya big data-tillvaro.

Vintern har börjat ta sitt grepp om Göteborg, och Rebecka Jörnstens kontor på Campus Johanneberg är så pass kallt att hon inte bara har en kraftig kofta utan även vantar på sig inomhus. Hon kurar ihop sig, småler och skruvar lite på sig lite generat när hon ska svara på frågan.
– Det känns förstås jättekul att ha fått priset. Jag tolkar det som en uppskattning av ämnesområdena statistik och biostatistik, vars betydelse ständigt ökar i och med utmaningar i analysering av stora datamängder. Jag har arbetat brett inom dessa områden.

Det är mitten av november och dagen efter att Rebecka Jörnsten har fått ta emot Naturvetenskapliga fakultetens forskningspris 2017. I motiveringen står bland annat att läsa att hon infört big data-paradigmet i den tidigare mer traditionellt inriktade statistikmiljön i Göteborg.

Historiskt har tillgängligheten på data varit ett problem för statistiker, men på senare år har det förändrats radikalt. I dag finns det enorma datamängder att tillgå, vilket ger helt nya möjligheter och utmaningar för Rebecka Jörnsten och hennes kollegor.
– Med små datamängder kan det vara svårt att dra slutsatser som är statistiskt säkerställda. Med stora datamängder blir det ”för lätt” om man inte tänker på helheten. Stora data kan vara problematiska att jobba med då de ofta är väldigt obalanserade och brokigt sammansatta av data från olika källor.

Det har snart gått nio år sedan östgöten Rebecka Jörnsten lämnade Rutger University i New Jersey och 14 års forskande i USA för att flytta tillbaka till Sverige. Hon påbörjade en anställning som forskare vid institutionen för matematiska vetenskaper. Den stora statistikavdelningen på institutionen lockade henne.
– Det var viktigt för mig att komma till en grupp som hade den sortens dynamik som finns här, att alla ämnen finns representerade. Och jag tyckte om Göteborgs småstadscharm. Men i början tyckte jag att det var konstigt att folk log så mycket mot mig, jag tänkte ”har jag spillt på mig?”

Om biostatistikern Rebecka Jörnsten ska beskriva sin forskning med ett ord så är det ”modellval”. Mer ingående handlar den om att utveckla statistiska modeller för storskaliga data, och hur de modellerna bland annat ska jämföras, visualiseras och tolkas. Ett av hennes större samarbeten är med forskaren Sven Nelander vid Uppsala universitet kring utveckling av nätverksmodeller som beskriver genomiska variationer mellan olika typer av cancer. Målet är att hitta så kallade biomarkörer som kan förutsäga hur enskilda patienter reagerar på behandlingar för olika sorters cancer. En biomarkör kan beskrivas som en mätbar indikator av ett biologiskt tillstånd.
– Bland det bästa med att vara statistiker är just att det går att hitta möjligheter till samarbete med forskare inom vitt skilda områden. Jag är till exempel med i ett medicinskt samarbete om hur musik kan användas som en alternativ behandlingsform.

I dag leder hon en grupp med två doktorander, och gruppen kommer att växa ytterligare. Hon har fått forskningsanslag som kommer att användas för att utöka med två doktorander och en postdok, men säger att det är svårt att få tag på bra personer.
– Utbildade statistiker är väldigt attraktiva på arbetsmarknaden och när de är klara med sin utbildning så får de fort anställning. Samtidigt har jag svårt att se att jag bygger upp ett jättestort lab, jag tycker om den mindre miljön och att ha de direkta personliga samtalen.

Samtidigt som de stora datamängderna skapar nya möjligheter så har också utvecklingen inom akademia gått mot snabbare och högre volym av publicering av resultat. Det gör det svårare att hitta rätt saker och ställer högre krav på källkritik och kritiskt tänkande. Hon jämför med hur det var när hon var doktorand.
– Då gick jag fysiskt till biblioteket och hämtade ut en journal med en artikel som jag ville ha tag i. I dag går det så fruktansvärt fort, det publiceras enorma mängder resultat i en växande mängd journaler, och det blir väldigt svårt att ha en överblick över hur mycket som finns och vad som är guldkornen.

Hon menar att det som forskare kan vara svårt att veta om man är i framkant eller akterseglad, vilket kan vara ett stressmoment.

Den ökande tillgängligheten av data och resultat är något Rebecka Jörnsten lyfter fram för sina studenter, och det leder till ny utveckling av statistik-kurser.
– Jag försöker alltid att göra mina kurser så mycket ”hands-on” som det går att göra, så att studenter får både lära sig något och tillämpa det. Nu finns det möjligheter för en student att göra väldigt mycket med riktiga data redan på grundnivå och senare utmanande analyser på stora data mängder från många olika fält. Men man måste, precis som i forskningen, se på det tillgängliga materialet med ett kritiskt öga. Koder och resultat online är inte alltid kvalitetssäkrat.

Rebecka Jörnsten

Ålder: 45 år
Familj: Dottern Ingeborg 4,5 år
Bor: Centrala Göteborg
Yrke: Professor i biostatistik och tillämpad statistik vid institutionen för matematiska vetenskaper
Fritiden: ”Jag spelar fiol i en suzukiförening ihop med min dotter. Jag spelade själv till och med gymnasiet, så det är ett sätt för mig att börja igen också.”
Då är jag lyckligast: ”När jag gör något med min mamma och Ingeborg. Och när vi har brainstorming-möten i min forskningsgrupp. Eller när en student kommer fram efter en föreläsning och säger ’jag hade inte tänkt på det sättet’, då blir jag jätteglad!”
Talang: ”Jag är bra på matlagning. Inte bakning för där måste man göra allting helt rätt annars blir det katastrof, men annan matlagning är roligt. ”