Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1301–1325 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Backprop-Free Reinforcement Learning with Active Neural Generative Coding	Jul 10, 2021	Q-Learningreinforcement-learning	CodeCode Available	1	5
Evening the Score: Targeting SARS-CoV-2 Protease Inhibition in Graph Generative Models for Therapeutic Candidates	May 7, 2021	Drug DesignDrug Discovery	CodeCode Available	1	5
Explaining Autonomous Driving Actions with Visual Question Answering	Jul 19, 2023	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1	5
Fast Population-Based Reinforcement Learning on a Single Machine	Jun 17, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
How Far I'll Go: Offline Goal-Conditioned Reinforcement Learning via f-Advantage Regression	Jun 7, 2022	regressionreinforcement-learning	CodeCode Available	1	5
Avalon: A Benchmark for RL Generalization Using Procedurally Generated Worlds	Oct 24, 2022	Deep Reinforcement LearningNavigate	CodeCode Available	1	5
Conservative Offline Distributional Reinforcement Learning	Jul 12, 2021	D4RLDistributional Reinforcement Learning	CodeCode Available	1	5
Avalanche RL: a Continual Reinforcement Learning Library	Feb 28, 2022	Continual LearningOpenAI Gym	CodeCode Available	1	5
An Experimental Design Perspective on Model-Based Reinforcement Learning	Dec 9, 2021	continuous-controlContinuous Control	CodeCode Available	1	5
A Crash Course on Reinforcement Learning	Mar 8, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Active Inference for Stochastic Control	Aug 27, 2021	Reinforcement Learning (RL)	CodeCode Available	1	5
ERL-Re^2: Efficient Evolutionary Reinforcement Learning with Shared State Representation and Individual Policy Representation	Oct 26, 2022	continuous-controlContinuous Control	CodeCode Available	1	5
Constrained Policy Optimization via Bayesian World Models	Jan 24, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1	5
Constraint-Guided Reinforcement Learning: Augmenting the Agent-Environment-Interaction	Apr 24, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Are Expressive Models Truly Necessary for Offline RL?	Dec 15, 2024	D4RLOffline RL	CodeCode Available	1	5
Constrained Variational Policy Optimization for Safe Reinforcement Learning	Jan 28, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Constrained Update Projection Approach to Safe Policy Optimization	Sep 15, 2022	Reinforcement Learning (RL)Safe Reinforcement Learning	CodeCode Available	1	5
Hybrid Multi-agent Deep Reinforcement Learning for Autonomous Mobility on Demand Systems	Dec 14, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1	5
EpidemiOptim: A Toolbox for the Optimization of Control Policies in Epidemiological Models	Oct 9, 2020	Deep Reinforcement LearningEpidemiology	CodeCode Available	1	5
Contextualized Rewriting for Text Summarization	Jan 31, 2021	Extractive Summarizationreinforcement-learning	CodeCode Available	1	5
Constructions in combinatorics via neural networks	Apr 29, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Contention Window Optimization in IEEE 802.11ax Networks with Deep Reinforcement Learning	Mar 3, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
A Reinforcement Learning Approach for Rebalancing Electric Vehicle Sharing Systems	Oct 5, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
ICU-Sepsis: A Benchmark MDP Built from Real Medical Data	Jun 9, 2024	BenchmarkingManagement	CodeCode Available	1	5
A Workflow for Offline Model-Free Robotic Reinforcement Learning	Sep 22, 2021	Offline RLreinforcement-learning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 53 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified