An open API service providing repository metadata for many open source software ecosystems.

Sujet: "td-lambda"

adik993/reinforcement-learning-sutton

langage: Python - taille: 75,2 ko - dernière synchronisation: il y a presque 3 ans - enregistré: il y a presque 6 ans - étoiles: 13 - forks: 3

khanhvu207/ddrl

Distributed Deep Reinforcement Learning Framework

langage: Jupyter Notebook - taille: 831 ko - dernière synchronisation: il y a 2 mois - enregistré: il y a presque 4 ans - étoiles: 5 - forks: 0

Pegah-Ardehkhani/Reinforcement-Learning-Algorithms-from-Scratch

Explore key RL algorithms with detailed explanations and fully commented Python code implementations

langage: Jupyter Notebook - taille: 2,36 Mo - dernière synchronisation: il y a 8 mois - enregistré: il y a environ un an - étoiles: 4 - forks: 0

PeeteKeesel/Basic-RL-Algorithms

:robot: Implementation and short explanation of basic RL algorithms, reproducing the simulations from Andrej Kaparthy's REINFORCEjs library.

langage: Python - taille: 18,8 Mo - dernière synchronisation: il y a plus de 2 ans - enregistré: il y a presque 3 ans - étoiles: 4 - forks: 0

TomGeorge1234/ThetaSequencesAreEligibilityTraces

Code for my paper: "Theta sequences as eligibility traces: a biological solution to credit assignment"

langage: Jupyter Notebook - taille: 2,05 Mo - dernière synchronisation: il y a 6 mois - enregistré: il y a plus de 2 ans - étoiles: 3 - forks: 0

MaviVestini/RL_HW2

Second homework for the Reinforcement Learning course

langage: Python - taille: 332 ko - dernière synchronisation: il y a environ 2 ans - enregistré: il y a environ 2 ans - étoiles: 0 - forks: 0

plopd/on-policy-experiments-td-and-etd

An Empirical Comparison of Temporal-Differences Learning Methods with Emphatic Temporal-Differences Learning Methods in the On-Policy Case.

langage: Python - taille: 35,2 ko - dernière synchronisation: il y a plus de 2 ans - enregistré: il y a plus de 2 ans - étoiles: 0 - forks: 0

plopd/plop-msc-thesis

A Comparison of Temporal-Difference Learning with Emphatic Temporal-Difference Learning

langage: Python - taille: 361 ko - dernière synchronisation: il y a plus de 2 ans - enregistré: il y a plus de 2 ans - étoiles: 0 - forks: 0

giulio-derasmo/Reinforcement-Learning-Projects

Repository of Reinforcement Learning projects done during the course @Sapienza

langage: Python - taille: 27,3 ko - dernière synchronisation: il y a presque 3 ans - enregistré: il y a presque 3 ans - étoiles: 0 - forks: 0

Anjali001/Reinforcement-Learning

langage: Jupyter Notebook - taille: 1,05 Mo - dernière synchronisation: il y a presque 3 ans - enregistré: il y a plus de 3 ans - étoiles: 0 - forks: 0

jolares/replicate-sutton-1998-td-lambda-experiments

Replicates the Random Walk Experiments from Sutton's 1998 paper "Learning to predict by the methods of Temporal Differences"

taille: 9,77 ko - dernière synchronisation: il y a 9 mois - enregistré: il y a plus de 4 ans - étoiles: 0 - forks: 0

rabieifk/Prison_Break_Machine_Learning

Machine-learning application in path finding using the n-step TD(lambda) algorithm

langage: Python - taille: 165 ko - dernière synchronisation: il y a plus de 2 ans - enregistré: il y a presque 5 ans - étoiles: 0 - forks: 0

dyth/Juno

Tic-Tac-Toe agent trained by Deep Reinforcement Learning

langage: Python - taille: 87,9 ko - dernière synchronisation: il y a 10 mois - enregistré: il y a plus de 7 ans - étoiles: 0 - forks: 1