Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2901–2925 of 15113 papers

Title	Date	Tasks	Status	Score
Improved Off-policy Reinforcement Learning in Biological Sequence Design	Oct 6, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	5
Improved robustness of reinforcement learning policies upon conversion to spiking neuronal network platforms applied to ATARI games	Mar 26, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Improving Portfolio Optimization Results with Bandit Networks	Oct 5, 2024	Portfolio OptimizationRecommendation Systems	CodeCode Available	5
Contrastive Explanations for Reinforcement Learning via Embedded Self Predictions	Oct 11, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Improving reinforcement learning algorithms: towards optimal learning rate policies	Nov 6, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Improving Reinforcement Learning Based Image Captioning with Natural Language Prior	Sep 13, 2018	Image Captioningreinforcement-learning	CodeCode Available	5
Importance Weighted Actor-Critic for Optimal Conservative Offline Reinforcement Learning	Jan 30, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
Improved Sample Complexity Bounds for Distributionally Robust Reinforcement Learning	Mar 5, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	5
Implicit Quantile Networks for Distributional Reinforcement Learning	Jun 14, 2018	Atari GamesDistributional Reinforcement Learning	CodeCode Available	5
Continuous Doubly Constrained Batch Reinforcement Learning	Feb 18, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
Importance Prioritized Policy Distillation	Aug 25, 2022	Atari GamesDecision Making	CodeCode Available	5
Improving the Efficient Neural Architecture Search via Rewarding Modifications	Dec 17, 2020	Neural Architecture Searchreinforcement-learning	CodeCode Available	5
Information State Embedding in Partially Observable Cooperative Multi-Agent Reinforcement Learning	Apr 2, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
Dealing with uncertainty: balancing exploration and exploitation in deep recurrent reinforcement learning	Oct 12, 2023	Autonomous Drivingreinforcement-learning	CodeCode Available	5
Continuous Deep Q-Learning with Simulator for Stabilization of Uncertain Discrete-Time Systems	Jan 13, 2021	Q-LearningReinforcement Learning (RL)	CodeCode Available	5
A general class of surrogate functions for stable and efficient reinforcement learning	Aug 12, 2021	MuJoCoPolicy Gradient Methods	CodeCode Available	5
Artificial Intelligence for Prosthetics - challenge solutions	Feb 7, 2019	Deep Reinforcement LearningImitation Learning	CodeCode Available	5
Impartial Games: A Challenge for Reinforcement Learning	May 25, 2022	Board GamesPosition	CodeCode Available	5
Continuous Control With Ensemble Deep Deterministic Policy Gradients	Nov 30, 2021	continuous-controlContinuous Control	CodeCode Available	5
Imitation Learning by Reinforcement Learning	Aug 10, 2021	continuous-controlContinuous Control	CodeCode Available	5
Imitation Learning for Sentence Generation with Dilated Convolutions Using Adversarial Training	Aug 15, 2019	DiversityGenerative Adversarial Network	CodeCode Available	5
Imperfect also Deserves Reward: Multi-Level and Sequential Reward Modeling for Better Dialog Management	Apr 10, 2021	Managementreinforcement-learning	CodeCode Available	5
Controllable Neural Story Plot Generation via Reward Shaping	Sep 27, 2018	Language ModelingLanguage Modelling	CodeCode Available	5
Incorporating Rivalry in Reinforcement Learning for a Competitive Game	Aug 22, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	5
Imagining In-distribution States: How Predictable Robot Behavior Can Enable User Control Over Learned Policies	Jun 19, 2024	Reinforcement Learning (RL)	CodeCode Available	5

Show:10 25 50

← PrevPage 117 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified