Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3826–3850 of 15113 papers

Title	Date	Tasks	Status	Score
B2RL: An open-source Dataset for Building Batch Reinforcement Learning	Sep 30, 2022	Managementreinforcement-learning	CodeCode Available	5
Adjust Planning Strategies to Accommodate Reinforcement Learning Agents	Mar 19, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	5
From Gameplay to Symbolic Reasoning: Learning SAT Solver Heuristics in the Style of Alpha(Go) Zero	Feb 14, 2018	Decision MakingDeep Reinforcement Learning	CodeCode Available	5
Action Priors for Large Action Spaces in Robotics	Jan 11, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
Constrained Policy Optimization with Explicit Behavior Density for Offline Reinforcement Learning	Jan 28, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
From Credit Assignment to Entropy Regularization: Two New Algorithms for Neural Sequence Prediction	Apr 29, 2018	Predictionreinforcement-learning	CodeCode Available	5
From Images to Connections: Can DQN with GNNs learn the Strategic Game of Hex?	Nov 22, 2023	Board GamesInductive Bias	CodeCode Available	5
Hierarchical Potential-based Reward Shaping from Task Specifications	Oct 6, 2021	Autonomous DrivingReinforcement Learning (RL)	CodeCode Available	5
Characterizing Attacks on Deep Reinforcement Learning	Jul 21, 2019	Atari GamesAutonomous Driving	CodeCode Available	5
FREED++: Improving RL Agents for Fragment-Based Molecule Generation by Thorough Reproduction	Jan 18, 2024	Molecular DockingReinforcement Learning (RL)	CodeCode Available	5
Fourier Features in Reinforcement Learning with Neural Networks	Sep 29, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
Risk-sensitive control as inference with Rényi divergence	Nov 4, 2024	Reinforcement Learning (RL)Variational Inference	CodeCode Available	5
Free energy-based reinforcement learning using a quantum processor	May 29, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	5
FORLORN: A Framework for Comparing Offline Methods and Reinforcement Learning for Optimization of RAN Parameters	Sep 8, 2022	Benchmarkingcontinuous-control	CodeCode Available	5
Foresee then Evaluate: Decomposing Value Estimation with Latent Future Prediction	Mar 3, 2021	continuous-controlContinuous Control	CodeCode Available	5
Free-Lunch Saliency via Attention in Atari Agents	Aug 7, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available	5
Challenging common bolus advisor for self-monitoring type-I diabetes patients using Reinforcement Learning	Jul 23, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
Challenges of Context and Time in Reinforcement Learning: Introducing Space Fortress as a Benchmark	Sep 6, 2018	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Flight Controller Synthesis Via Deep Reinforcement Learning	Sep 14, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Challenges in High-dimensional Reinforcement Learning with Evolution Strategies	Jun 4, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	5
Backpropagation through the Void: Optimizing control variates for black-box gradient estimation	Oct 31, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	5
Flexible Option Learning	Dec 6, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available	5
Flappy Hummingbird: An Open Source Dynamic Simulation of Flapping Wing Robots and Animals	Feb 25, 2019	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	5
Fleet Control using Coregionalized Gaussian Process Policy Iteration	Nov 22, 2019	Gaussian Processesreinforcement-learning	CodeCode Available	5
Frequentist Regret Bounds for Randomized Least-Squares Value Iteration	Nov 1, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5

Show:10 25 50

← PrevPage 154 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified