fbpx

Hvordan lager vi prognoser for luftkvalitet og pollen?

Fra rådata til prognoser

Veldig enkelt sagt samler vi inn data fra mange ulike kilder, lagrer dataene og kjører våre beregninger for å gi kundene våre målinger og prognoser. 

Vi som jobber i Airmine har bakgrunn fra modellering, miljøteknologier og programmering. Vi er over middels glade i å analysere data og finne sammenhenger som kan modelleres.

data flow - Airmine

Sensorene lærer av hverandre (og seg selv)

Vi samler inn data fra airminer-sensorene og bruker dette både til å vise historiske måledata til hver enkelt kunde og til å la sensorer i nærheten lære av hverandre. 

Sensorene måler partikler i ulike størrelser (vi snakker µm, sånn som PM2.5, den viktigste indikatoren på helseskadelig svevestøv). For å beregne nivåer av svevestøv fram i tid, bruker vi maskinlæring. Ideen er at prognosene for hver enkelt sensor blir bedre og bedre etterhvert som modellen lærer.

Pollenmålinger - målet vårt

Vi har etablert algoritmer som gjør det mulig å skille mellom svevestøv og pollen, men for at vi skal kunne anvende disse må sensoren samle inn data over en lengre periode. Inntil sensoren har samlet inn nok data, bruker vi en modell som blant annet bygger på data fra andre målinger, vegetasjonsdata og værdata.

Den første tiden vil det med andre ord ikke være en direkte sammenheng mellom det som måles av den enkelte sensoren og pollennivåene som beregnes. På sikt vil vi kombinere de to modellene for å gi best mulig oppløsning både i tid og rom.

planteklassifisering vha satelittdata

Planteklassifisering med satellittdata

For å kartlegge om det er mange planter i nærheten som kan avgi pollen bruker vi satellittdata (fra ESA, Sentinel-2). Vi kan da klassifisere vegetasjonen, altså avgjøre hvilke planteslag som vokser i nærheten av sensorene. 

Vi bruker maskinlæringsalgoritmer både til å bestemme plantetyper og til å beregne pollennivåer. (Les mer om dette i artikkelen How to spot a birch tree from space.)

Vi samler data hele tiden for bedre modeller

For å trene maskinlæringsmodellene trenger vi referansedata, altså data hvor vi “kjenner fasiten”. Her bruker vi både offentlige datakilder og manuelt innsamlete data. 

 Vi kjører maskinlæringen både for hver enkelt sensor, og samlet for flere sensorer. Målet er at modellene gradvis blir mer presise – jo mer data vi samler inn, jo mer treffsikre blir modellene.

Handlekurv
Norsk bokmål