Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4476–4500 of 15113 papers

Title	Date	Tasks	Status	Score
Mean Actor Critic	Sep 1, 2017	Atari Gamesreinforcement-learning	CodeCode Available	5
Scaling Laws for a Multi-Agent Reinforcement Learning Model	Sep 29, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	5
Efficient Meta Subspace Optimization	Oct 28, 2021	Reinforcement Learning (RL)	CodeCode Available	5
Reinforcement Learning Experiments and Benchmark for Solving Robotic Reaching Tasks	Nov 11, 2020	Positionreinforcement-learning	CodeCode Available	5
Multi-Agent Deep Reinforcement Learning for Dynamic Power Allocation in Wireless Networks	Aug 1, 2018	Deep Reinforcement LearningQ-Learning	CodeCode Available	5
Variational Delayed Policy Optimization	May 23, 2024	MuJoCoReinforcement Learning (RL)	CodeCode Available	5
Variational Generative Stochastic Networks with Collaborative Shaping	Aug 2, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	5
Multi-Agent Deep Reinforcement Learning for Large-scale Traffic Signal Control	Mar 11, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available	5
Variational Information Maximisation for Intrinsically Motivated Reinforcement Learning	Sep 29, 2015	BIG-bench Machine Learningreinforcement-learning	CodeCode Available	5
Variational Intrinsic Control	Nov 22, 2016	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	5
Budgeted Reinforcement Learning in Continuous State Space	Mar 3, 2019	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available	5
On Solving the 2-Dimensional Greedy Shooter Problem for UAVs	Nov 2, 2019	Q-Learningreinforcement-learning	CodeCode Available	5
Variational Quantum Circuits for Deep Reinforcement Learning	Jun 30, 2019	BIG-bench Machine LearningDecision Making	CodeCode Available	5
Policy Poisoning in Batch Reinforcement Learning and Control	Oct 13, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Neural Architecture Search with Reinforcement Learning	Nov 5, 2016	Image ClassificationLanguage Modeling	CodeCode Available	5
Scheduled Policy Optimization for Natural Language Communication with Intelligent Agents	Jun 16, 2018	Efficient Explorationreinforcement-learning	CodeCode Available	5
Variational Recurrent Models for Solving Partially Observable Control Tasks	Dec 23, 2019	Deep Reinforcement LearningMemorization	CodeCode Available	5
Reinforcement Learning for Automatic Test Case Prioritization and Selection in Continuous Integration	Nov 9, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	5
Variation-resistant Q-learning: Controlling and Utilizing Estimation Bias in Reinforcement Learning for Better Performance	Feb 1, 2021	Q-Learningreinforcement-learning	CodeCode Available	5
Model-Based Reinforcement Learning for Atari	Mar 1, 2019	Atari GamesAtari Games 100k	CodeCode Available	5
Reinforcement Learning for Bandit Neural Machine Translation with Simulated Human Feedback	Jul 24, 2017	DecoderMachine Translation	CodeCode Available	5
On the calibration of compartmental epidemiological models	Dec 9, 2023	Decision MakingReinforcement Learning (RL)	CodeCode Available	5
Verifiable and Compositional Reinforcement Learning Systems	Jun 7, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
On the Challenges of using Reinforcement Learning in Precision Drug Dosing: Delay and Prolongedness of Action Effects	Jan 2, 2023	Reinforcement Learning (RL)	CodeCode Available	5
Verifying Controllers Against Adversarial Examples with Bayesian Optimization	Feb 23, 2018	Bayesian Optimizationreinforcement-learning	CodeCode Available	5

Show:10 25 50

← PrevPage 180 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified