Progress for week 11 (2018)

From Robin

(Difference between revisions)
Jump to: navigation, search
(Vetle Bu Solgård)
Line 7: Line 7:
* RL PoWER and simple policy gradient (AIBO)
* RL PoWER and simple policy gradient (AIBO)
* Got working implementation of RL PoWER inspired algorithm
* Got working implementation of RL PoWER inspired algorithm
 +
{|style="margin: 0 auto;"
 +
| [[File:Figure_1_200iter.png‎|300px|thumb|upright|alt=Tabula rasa|]]
 +
|}
 +
== Martin Hovin ==
== Martin Hovin ==

Revision as of 12:58, 16 March 2018

Contents

Vetle Bu Solgård

Budget

  • Finish research of RL algorithm implementation
  • Start implementation

Accounting

  • RL PoWER and simple policy gradient (AIBO)
  • Got working implementation of RL PoWER inspired algorithm
Tabula rasa


Martin Hovin

Budget

  • Fullføre skriving om Search experimentene
    • Gjøre noe statistisk analyse av resultatene?

Accounting

  • Skrevet ferdig første (typ v 0.01) utkast av Search eksperimentene
    • Oppdaget feil i implementasjonen som er fikset nå. Eksperimentene er startet på nytt og skal være ferdig til neste søndag
  • Startet arbeidet på Databruk-skrivingen
    • Første resultatene er klar
Tabula rasa
Pretraining
Accuracy comparison
Personal tools
Front page