Reinforcement learning experiments

Learning RL by implementing and analysing different RL methods from scratch.

Directory	Game	Number of agents	RL method
nim-dqn	Nim-21	2	Deep Q-network
nim-a2c	Nim-21	2	Advantage Actor Critic
matching-pennies-a2c	Matching Pennies	2	Advantage Actor Critic
snake-a2c	Snake	1	Advantage Actor Critic
snake-ppo	Snake	1	Proximal Policy Optimisation

MLFlow

I'm also using this project to learn more about MLFlow. Some of the train scripts depend on an actively running tracking server. Please check MLFlow documentation on how to start a tracking server and set the MLFLOW_URI environment variable to the correct tracking server URL.

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
matching-pennies-a2c		matching-pennies-a2c
nim-a2c		nim-a2c
nim-dqn		nim-dqn
snake-a2c		snake-a2c
snake-ppo		snake-ppo
.env		.env
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reinforcement learning experiments

MLFlow

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Reinforcement learning experiments

MLFlow

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages