GitHub topics: preference-based-reinforcement-learning

Share RL study material

Size: 10.5 MB - Last synced at: 5 days ago - Pushed at: 5 days ago - Stars: 0 - Forks: 0

A repo for Implemented online preference-based reward learning under human irrationality & delayed feedback

Language: Python - Size: 14.6 KB - Last synced at: 18 days ago - Pushed at: 18 days ago - Stars: 2 - Forks: 0

Official implementation of "Direct Preference-based Policy Optimization without Reward Modeling" (NeurIPS 2023)

Language: Python - Size: 26.5 MB - Last synced at: 11 months ago - Pushed at: 11 months ago - Stars: 35 - Forks: 1

Code for the paper "Reward Design for Justifiable Sequential Decision-Making"; ICLR 2024

Language: Jupyter Notebook - Size: 2.2 MB - Last synced at: over 1 year ago - Pushed at: over 1 year ago - Stars: 0 - Forks: 0

Related Keywords

ecosyste.ms