Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5951–6000 of 15113 papers

Title	Date	Tasks	Status
Understanding the Evolution of Linear Regions in Deep Reinforcement Learning	Oct 24, 2022	continuous-controlContinuous Control	CodeCode Available
OSS Mentor A framework for improving developers contributions via deep reinforcement learning	Oct 24, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
MEET: A Monte Carlo Exploration-Exploitation Trade-off for Buffer Sampling	Oct 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Reachability-Aware Laplacian Representation in Reinforcement Learning	Oct 24, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning and Bandits for Speech and Language Processing: Tutorial, Review and Outlook	Oct 24, 2022	Recommendation Systemsreinforcement-learning	—Unverified
Opportunistic Episodic Reinforcement Learning	Oct 24, 2022	reinforcement-learningReinforcement Learning	—Unverified
MetaEMS: A Meta Reinforcement Learning-based Control Framework for Building Energy Management System	Oct 23, 2022	energy managementManagement	—Unverified
Active Predictive Coding: A Unified Neural Framework for Learning Hierarchical World Models for Perception and Planning	Oct 23, 2022	reinforcement-learningReinforcement Learning	—Unverified
Learning General World Models in a Handful of Reward-Free Deployments	Oct 23, 2022	Active LearningDeep Reinforcement Learning	—Unverified
LEAGUE: Guided Skill Learning and Abstraction for Long-Horizon Manipulation	Oct 23, 2022	Deep Reinforcement LearningMotion Planning	—Unverified
A Cooperative Reinforcement Learning Environment for Detecting and Penalizing Betrayal	Oct 23, 2022	reinforcement-learningReinforcement Learning	—Unverified
Climate Change Policy Exploration using Reinforcement Learning	Oct 23, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Faster and more diverse de novo molecular optimization with double-loop reinforcement learning using augmented SMILES	Oct 22, 2022	DiversityDrug Discovery	—Unverified
Attitude Control of Highly Maneuverable Aircraft Using an Improved Q-learning	Oct 22, 2022	continuous-controlContinuous Control	—Unverified
Probing Transfer in Deep Reinforcement Learning without Task Engineering	Oct 22, 2022	Deep Reinforcement LearningGame Design	—Unverified
Epistemic Monte Carlo Tree Search	Oct 21, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Towards Quantum-Enabled 6G Slicing	Oct 21, 2022	Deep Reinforcement LearningFederated Learning	—Unverified
On the connection between Bregman divergence and value in regularized Markov decision processes	Oct 21, 2022	reinforcement-learningReinforcement Learning	—Unverified
Rate-Splitting for Intelligent Reflecting Surface-Aided Multiuser VR Streaming	Oct 21, 2022	Continuous ControlDeep Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Stabilization of Large-scale Probabilistic Boolean Networks	Oct 21, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Redefining Counterfactual Explanations for Reinforcement Learning: Overview, Challenges and Opportunities	Oct 21, 2022	counterfactualreinforcement-learning	—Unverified
Continual Vision-based Reinforcement Learning with Group Symmetries	Oct 21, 2022	Autonomous Drivingreinforcement-learning	—Unverified
Integrating Policy Summaries with Reward Decomposition for Explaining Reinforcement Learning Agents	Oct 21, 2022	Decision Makingreinforcement-learning	—Unverified
Group Distributionally Robust Reinforcement Learning with Hierarchical Latent Variables	Oct 21, 2022	MuJoCoreinforcement-learning	—Unverified
Biologically Plausible Variational Policy Gradient with Spiking Recurrent Winner-Take-All Networks	Oct 21, 2022	AllReinforcement Learning (RL)	CodeCode Available
Implicit Offline Reinforcement Learning via Supervised Learning	Oct 21, 2022	Offline RLreinforcement-learning	—Unverified
Deep Reinforcement Learning for Inverse Inorganic Materials Design	Oct 21, 2022	Deep Reinforcement LearningDiversity	—Unverified
Horizon-Free and Variance-Dependent Reinforcement Learning for Latent Markov Decision Processes	Oct 20, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Fine-Grained Session Recommendations in E-commerce using Deep Reinforcement Learning	Oct 20, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Task Phasing: Automated Curriculum Learning from Demonstrations	Oct 20, 2022	Reinforcement Learning (RL)	CodeCode Available
Model-based Lifelong Reinforcement Learning with Bayesian Exploration	Oct 20, 2022	modelreinforcement-learning	CodeCode Available
The Pump Scheduling Problem: A Real-World Scenario for Reinforcement Learning	Oct 20, 2022	Deep Reinforcement LearningOffline RL	CodeCode Available
Safe Policy Improvement in Constrained Markov Decision Processes	Oct 20, 2022	Reinforcement Learning (RL)	—Unverified
Robust Imitation via Mirror Descent Inverse Reinforcement Learning	Oct 20, 2022	Density EstimationImitation Learning	—Unverified
Provably Safe Reinforcement Learning via Action Projection using Reachability Analysis and Polynomial Zonotopes	Oct 19, 2022	reinforcement-learningReinforcement Learning	—Unverified
Scaling Laws for Reward Model Overoptimization	Oct 19, 2022	modelreinforcement-learning	—Unverified
Palm up: Playing in the Latent Manifold for Unsupervised Pretraining	Oct 19, 2022	reinforcement-learningReinforcement Learning	—Unverified
Robust Offline Reinforcement Learning with Gradient Penalty and Constraint Relaxation	Oct 19, 2022	D4RLMuJoCo	—Unverified
Robotic Table Wiping via Reinforcement Learning and Whole-body Trajectory Optimization	Oct 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Robot Navigation with Reinforcement Learned Path Generation and Fine-Tuned Motion Control	Oct 19, 2022	Reinforcement Learning (RL)Robot Navigation	—Unverified
Oracles & Followers: Stackelberg Equilibria in Deep Multi-Agent Reinforcement Learning	Oct 19, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
When to Ask for Help: Proactive Interventions in Autonomous Reinforcement Learning	Oct 19, 2022	continuous-controlContinuous Control	CodeCode Available
On the Power of Pre-training for Generalization in RL: Provable Benefits and Hardness	Oct 19, 2022	Reinforcement Learning (RL)	—Unverified
Learning Preferences for Interactive Autonomy	Oct 19, 2022	Active LearningAutonomous Driving	CodeCode Available
Integrated Decision and Control for High-Level Automated Vehicles by Mixed Policy Gradient and Its Experiment Verification	Oct 19, 2022	Autonomous DrivingDecision Making	—Unverified
A Reinforcement Learning Approach in Multi-Phase Second-Price Auction Design	Oct 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Hierarchical Reinforcement Learning for Furniture Layout in Virtual Indoor Scenes	Oct 19, 2022	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
CLUTR: Curriculum Learning via Unsupervised Task Representation Learning	Oct 19, 2022	Reinforcement Learning (RL)Representation Learning	CodeCode Available
CEIP: Combining Explicit and Implicit Priors for Reinforcement Learning with Demonstrations	Oct 18, 2022	Formreinforcement-learning	CodeCode Available
Unpacking Reward Shaping: Understanding the Benefits of Reward Engineering on Sample Complexity	Oct 18, 2022	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 120 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified