Progress for week 11 (2018)

Fra Robin

Gå til: navigasjon, søk

Innhold

Vetle Bu Solgård

Budget

  • Finish research of RL algorithm implementation
  • Start implementation

Accounting

  • RL PoWER and simple policy gradient (AIBO) possible candidates
  • Got working implementation of RL PoWER inspired algorithm
Tabula rasa

Martin Hovin

Budget

  • Fullføre skriving om Search experimentene
    • Gjøre noe statistisk analyse av resultatene?

Accounting

  • Skrevet ferdig første (typ v 0.01) utkast av Search eksperimentene
    • Oppdaget feil i implementasjonen som er fikset nå. Eksperimentene er startet på nytt og skal være ferdig til neste søndag
  • Startet arbeidet på Databruk-skrivingen
    • Første resultatene er klar
Tabula rasa
Pretraining
Accuracy comparison
Personlige verktøy