Progress for week 11 (2018)
From Robin
(Difference between revisions)
(→Accounting) |
|||
Line 5: | Line 5: | ||
=== Accounting === | === Accounting === | ||
- | * RL PoWER and simple policy gradient (AIBO) | + | * RL PoWER and simple policy gradient (AIBO) possible candidates |
* Got working implementation of RL PoWER inspired algorithm | * Got working implementation of RL PoWER inspired algorithm | ||
{|style="margin: 0 auto;" | {|style="margin: 0 auto;" | ||
| [[File:Figure_1_200iter.png|300px|thumb|upright|alt=Tabula rasa|]] | | [[File:Figure_1_200iter.png|300px|thumb|upright|alt=Tabula rasa|]] | ||
|} | |} | ||
- | |||
== Martin Hovin == | == Martin Hovin == |
Current revision as of 12:59, 16 March 2018
Contents |
Vetle Bu Solgård
Budget
- Finish research of RL algorithm implementation
- Start implementation
Accounting
- RL PoWER and simple policy gradient (AIBO) possible candidates
- Got working implementation of RL PoWER inspired algorithm
Martin Hovin
Budget
- Fullføre skriving om Search experimentene
- Gjøre noe statistisk analyse av resultatene?
Accounting
- Skrevet ferdig første (typ v 0.01) utkast av Search eksperimentene
- Oppdaget feil i implementasjonen som er fikset nå. Eksperimentene er startet på nytt og skal være ferdig til neste søndag
- Startet arbeidet på Databruk-skrivingen
- Første resultatene er klar