Progress for week 11 (2018)

From Robin

(Difference between revisions)
Jump to: navigation, search
(Accounting)
 
Line 5: Line 5:
=== Accounting ===
=== Accounting ===
-
* RL PoWER and simple policy gradient (AIBO)
+
* RL PoWER and simple policy gradient (AIBO) possible candidates
* Got working implementation of RL PoWER inspired algorithm
* Got working implementation of RL PoWER inspired algorithm
{|style="margin: 0 auto;"
{|style="margin: 0 auto;"
| [[File:Figure_1_200iter.png‎|300px|thumb|upright|alt=Tabula rasa|]]
| [[File:Figure_1_200iter.png‎|300px|thumb|upright|alt=Tabula rasa|]]
|}
|}
-
 
== Martin Hovin ==
== Martin Hovin ==

Current revision as of 12:59, 16 March 2018

Contents

Vetle Bu Solgård

Budget

  • Finish research of RL algorithm implementation
  • Start implementation

Accounting

  • RL PoWER and simple policy gradient (AIBO) possible candidates
  • Got working implementation of RL PoWER inspired algorithm
Tabula rasa

Martin Hovin

Budget

  • Fullføre skriving om Search experimentene
    • Gjøre noe statistisk analyse av resultatene?

Accounting

  • Skrevet ferdig første (typ v 0.01) utkast av Search eksperimentene
    • Oppdaget feil i implementasjonen som er fikset nå. Eksperimentene er startet på nytt og skal være ferdig til neste søndag
  • Startet arbeidet på Databruk-skrivingen
    • Første resultatene er klar
Tabula rasa
Pretraining
Accuracy comparison
Personal tools
Front page