Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4526–4550 of 15113 papers

Title	Date	Tasks	Status	Hype
Attitude Control of Highly Maneuverable Aircraft Using an Improved Q-learning	Oct 22, 2022	continuous-controlContinuous Control	—Unverified	0
Faster and more diverse de novo molecular optimization with double-loop reinforcement learning using augmented SMILES	Oct 22, 2022	DiversityDrug Discovery	—Unverified	0
Probing Transfer in Deep Reinforcement Learning without Task Engineering	Oct 22, 2022	Deep Reinforcement LearningGame Design	—Unverified	0
Towards Quantum-Enabled 6G Slicing	Oct 21, 2022	Deep Reinforcement LearningFederated Learning	—Unverified	0
Rate-Splitting for Intelligent Reflecting Surface-Aided Multiuser VR Streaming	Oct 21, 2022	Continuous ControlDeep Reinforcement Learning	CodeCode Available	0
Epistemic Monte Carlo Tree Search	Oct 21, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
On the connection between Bregman divergence and value in regularized Markov decision processes	Oct 21, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Implicit Offline Reinforcement Learning via Supervised Learning	Oct 21, 2022	Offline RLreinforcement-learning	—Unverified	0
Continual Vision-based Reinforcement Learning with Group Symmetries	Oct 21, 2022	Autonomous Drivingreinforcement-learning	—Unverified	0
Biologically Plausible Variational Policy Gradient with Spiking Recurrent Winner-Take-All Networks	Oct 21, 2022	AllReinforcement Learning (RL)	CodeCode Available	0
Group Distributionally Robust Reinforcement Learning with Hierarchical Latent Variables	Oct 21, 2022	MuJoCoreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Stabilization of Large-scale Probabilistic Boolean Networks	Oct 21, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Redefining Counterfactual Explanations for Reinforcement Learning: Overview, Challenges and Opportunities	Oct 21, 2022	counterfactualreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Inverse Inorganic Materials Design	Oct 21, 2022	Deep Reinforcement LearningDiversity	—Unverified	0
Integrating Policy Summaries with Reward Decomposition for Explaining Reinforcement Learning Agents	Oct 21, 2022	Decision Makingreinforcement-learning	—Unverified	0
PaCo: Parameter-Compositional Multi-Task Reinforcement Learning	Oct 21, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Fine-Grained Session Recommendations in E-commerce using Deep Reinforcement Learning	Oct 20, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Horizon-Free and Variance-Dependent Reinforcement Learning for Latent Markov Decision Processes	Oct 20, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Robust Imitation via Mirror Descent Inverse Reinforcement Learning	Oct 20, 2022	Density EstimationImitation Learning	—Unverified	0
Model-based Lifelong Reinforcement Learning with Bayesian Exploration	Oct 20, 2022	modelreinforcement-learning	CodeCode Available	0
MoCoDA: Model-based Counterfactual Data Augmentation	Oct 20, 2022	counterfactualData Augmentation	CodeCode Available	1
The Pump Scheduling Problem: A Real-World Scenario for Reinforcement Learning	Oct 20, 2022	Deep Reinforcement LearningOffline RL	CodeCode Available	0
Safe Policy Improvement in Constrained Markov Decision Processes	Oct 20, 2022	Reinforcement Learning (RL)	—Unverified	0
Task Phasing: Automated Curriculum Learning from Demonstrations	Oct 20, 2022	Reinforcement Learning (RL)	CodeCode Available	0
RMBench: Benchmarking Deep Reinforcement Learning for Robotic Manipulator Control	Oct 20, 2022	BenchmarkingData Augmentation	CodeCode Available	1

Show:10 25 50

← PrevPage 182 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified