Timelønnet ML for jordanalyse ved ROBIN

From Robin

Jump to: navigation, search

Ledige deltidsstillinger som vitenskapelig assistent ved ROBIN (timelønnet)

ROBIN-gruppen har en omfattende aktivitet inkludert en rekke laboratorieaktivitet og forskningsprosjekter. For å assistere oss, søker vi nå studenter (fortrinnsvis studenter som går 3. år bachelor eller masterstudent på 1. året på I:RIS) til å jobbe som deltidsansatt vitenskapelig assistent for ROBIN.

Vi lyser ut en stilling for en eller flere maskinlæringsutvikler(e) av jordanalysemodeller:

Maskinlæringsutvikler av jordanalysemodeller

UiO er partner i et prosjekt finansiert av Norges forskningsråd som fokuserer på globale utfordringer i landbruket. Vi trenger kompetente informatikere til å undersøke sammenhengen mellom avling, jordhelse, jordliv og karbonlagring ved hjelp av maskinlæring. Et team bestående av forskere på UiO, NMBU og SmartSoil AS samarbeider i prosjektet, hvor hensikten er å gjøre jordbruket mer bærekraftig gjennom å redusere bruk av syntetiske gjødselskilder og heller la mikroorganismer forbedre jorden.

Stillingen omfatter innhenting av registrerte data, kategorisering og kartlegging av data, samt implementering og trening av maskinlæringsmodeller. Analyser og evaluering av resultater vil bidra til å forstå hva som må til for å øke diversitet og kompleksitet av mikroorganismer i jorden, slik at nyvinnende og bærekraftige tilsetninger kan forbedre avling for bønder i Norge. Metodene og resultatene av arbeidet skal beskrives i en eller flere vitenskapelige artikler. To ROBIN-studenter har jobbet med disse oppgavene sommeren og høsten 2023, og den/de som nå ansettes er ment å fortsette dette arbeidet.

Arbeidsoppgaver:

  • Vurdere om det finnes nye offentlig tilgjengelig data i relevante jord og jordsmonn-databaser nasjonalt og innen EU enn de som er brukt så langt
  • Eventuelt samle inn og kategorisere data ved hjelp av nedlasting og/eller tilgjengelige API-er
  • Bidra med koding, trening og evaluering av maskinlæringsmodeller.
  • Videreutvikle eksisterende og evt. skrive flere vitenskapelige artikler

Kvalifikasjoner:

  • Kandidaten må ha kjennskap til programmering (f.eks Python eller andre høy-nivå programmeringsspråk)
  • Kandidaten må ha kjennskap og erfaring med maskinlæring (f.eks Tensorflow, PyTorch el.)
  • Kjennskap til kategorisering, annotering og lagring av data, samt statistiske metoder for evaluering av maskinlæringsalgoritmer er også ønskelig

Generell Prosjektbeskrivelse:

Offentlige datakilder som NIBIO, GAS og LUKAS (se boks 1 i figuren nedenfor) inneholder store mengder geografiske data om jord og jordsmonn som er veldig relevante for analyse og modellering med maskinlæring. Eksempler på data som er relevante å sammenstille og kombinere i en modell er nedbør, temperatur, jordkvalitet, erosjon og karboninnhold. Ved å samle inn denne informasjonen og bruke den som utgangspunkt i en maskinlæringsmodell kan vi f.eks. bruke modellen til:

  • Å tilegne nye jordprøver informasjon som ikke dekkes geografisk av datakildene
  • Å ekspandere/generalisere data til nye geografiske områder
  • Å modellere og predikere hvilke faktorer som er viktige for best og mest mulig avling

Første steg i prosessen er å etablere en prosedyre for nedlasting/datainnsamling enten manuelt eller via et API (2, 8). NIBIO har to forskjellige tjenere (API) tilgjengelige samt mulighet for nedlasting av mesteparten av geografisk data til lokal disk. Tjeneren trenger i hovedsak to funksjonaliteter:

  • Å kunne tilegne en jordprøve data fra NIBIO gitt GPS-koordinater (8)
  • Å kunne laste ned større mengder data som videre kategoriseres, sorteres og brukes som treningsdata i en maskinlæringsmodell (2)

Innsamlet data må sorteres, kategoriseres og struktureres (3) slik at det enkelt og dynamisk kan plukkes diskre geografiske attributter og sannheter (Labels), konvertere disse til maskinlæringsdata og trene modeller vha. av et rammeverk, for eksempel i PyTorch, Tensorflow eller lignende. Data lagres enten i en database eller i “flat files”, f.eks TSV, CSV eller lignende.

Treningsdata brukes av treningsmodul (5) som må implementeres, helst ved hjelp av etablerte KI-bibliotek for Python som allerede er nevnt. Treningsmodulen må gjøre kryssvalidering, og forskjellige algoritmer, topologier og datatransformasjoner må testes og måles i form av spesifisitet, sensitivitet og andre metrikker. Modeller lagres (6) slik at de kan brukes av en klassifiseringsmodul (7) som predikerer manglende/nye sannheter om en ny jordprøve basert på GPS data (f.eks jordkvalitet generalisert fra modellen).

Image: Jordanalysemodellering.jpg

Figur: Overordnet arbeidsflyt og dataflyt


Kontakt for nærmere informasjon: prof. Jim Tørresen (ROBIN)

Interessert?

Send en kortfattet søknad med CV og karakterutskrift der din kompetanse og erfaring relatert til stillingen framgår (se beskrevne kvalifikasjoner over). Skriv også i hvilken grad du mener du har anledning til å jobbe i det omfanget som er angitt nedenfor. Vi prioriterer i denne utlysningen studenter som går siste året bachelor i Informatikk: Robotikk og Intelligente systemer og som har plan om å fortsette på tilsvarende masterprogram fra høsten 2024 (så du må angi i søknaden om du planlegger det). Kriterier for utvelgelse vil både være kvalifikasjoner og kandidaters kapasitet til å jobbe som angitt nedenfor.

Tiltredelse: Så snart som mulig og fortrinnsvis senest 4. mars 2024.

Varighet: Ut 2024.

Stillingsandel: 20% gjennom semesteret og evt. 3-4 ukers fulltids jobb sommeren 2024 (prosjektet varer ut 2024).

Lønn: Lønnes etter stillingskode 1018, 1019 eller 1020, avhengig av kompetanse og ansiennitet og basert på innleverte timelister.

Søknaden merkes med "Søknad ML-stilling jordanalyse ved ROBIN" i emnefeltet og sendes senest 15.02.2024 til Jim Tørresen. Aktuelle kandidater vil bli innkalt til intervju etter fristens utløp.

Personal tools
Front page