Progress for week 11 (2018)
From Robin
(Difference between revisions)
(→Vetle Bu Solgård) |
|||
Line 7: | Line 7: | ||
* RL PoWER and simple policy gradient (AIBO) | * RL PoWER and simple policy gradient (AIBO) | ||
* Got working implementation of RL PoWER inspired algorithm | * Got working implementation of RL PoWER inspired algorithm | ||
+ | {|style="margin: 0 auto;" | ||
+ | | [[File:Figure_1_200iter.png|300px|thumb|upright|alt=Tabula rasa|]] | ||
+ | |} | ||
+ | |||
== Martin Hovin == | == Martin Hovin == |
Revision as of 12:58, 16 March 2018
Contents |
Vetle Bu Solgård
Budget
- Finish research of RL algorithm implementation
- Start implementation
Accounting
- RL PoWER and simple policy gradient (AIBO)
- Got working implementation of RL PoWER inspired algorithm
Martin Hovin
Budget
- Fullføre skriving om Search experimentene
- Gjøre noe statistisk analyse av resultatene?
Accounting
- Skrevet ferdig første (typ v 0.01) utkast av Search eksperimentene
- Oppdaget feil i implementasjonen som er fikset nå. Eksperimentene er startet på nytt og skal være ferdig til neste søndag
- Startet arbeidet på Databruk-skrivingen
- Første resultatene er klar