Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4551–4600 of 15113 papers

Title	Date	Tasks	Status	Hype
Hypernetworks in Meta-Reinforcement Learning	Oct 20, 2022	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1
Robotic Table Wiping via Reinforcement Learning and Whole-body Trajectory Optimization	Oct 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Oracles & Followers: Stackelberg Equilibria in Deep Multi-Agent Reinforcement Learning	Oct 19, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
On the Power of Pre-training for Generalization in RL: Provable Benefits and Hardness	Oct 19, 2022	Reinforcement Learning (RL)	—Unverified	0
On the Feasibility of Cross-Task Transfer with Model-Based Reinforcement Learning	Oct 19, 2022	Atari Games 100kModel-based Reinforcement Learning	CodeCode Available	1
Palm up: Playing in the Latent Manifold for Unsupervised Pretraining	Oct 19, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Provably Safe Reinforcement Learning via Action Projection using Reachability Analysis and Polynomial Zonotopes	Oct 19, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Robot Navigation with Reinforcement Learned Path Generation and Fine-Tuned Motion Control	Oct 19, 2022	Reinforcement Learning (RL)Robot Navigation	—Unverified	0
Robust Offline Reinforcement Learning with Gradient Penalty and Constraint Relaxation	Oct 19, 2022	D4RLMuJoCo	—Unverified	0
Scaling Laws for Reward Model Overoptimization	Oct 19, 2022	modelreinforcement-learning	—Unverified	0
When to Ask for Help: Proactive Interventions in Autonomous Reinforcement Learning	Oct 19, 2022	continuous-controlContinuous Control	CodeCode Available	0
Hierarchical Reinforcement Learning for Furniture Layout in Virtual Indoor Scenes	Oct 19, 2022	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
A Reinforcement Learning Approach in Multi-Phase Second-Price Auction Design	Oct 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Learning Preferences for Interactive Autonomy	Oct 19, 2022	Active LearningAutonomous Driving	CodeCode Available	0
CLUTR: Curriculum Learning via Unsupervised Task Representation Learning	Oct 19, 2022	Reinforcement Learning (RL)Representation Learning	CodeCode Available	0
Integrated Decision and Control for High-Level Automated Vehicles by Mixed Policy Gradient and Its Experiment Verification	Oct 19, 2022	Autonomous DrivingDecision Making	—Unverified	0
DIAMBRA Arena: a New Reinforcement Learning Platform for Research and Experimentation	Oct 19, 2022	Deep Reinforcement LearningImitation Learning	CodeCode Available	2
Curriculum Reinforcement Learning using Optimal Transport via Gradual Domain Adaptation	Oct 18, 2022	Domain Adaptationreinforcement-learning	CodeCode Available	1
Deep Black-Box Reinforcement Learning with Movement Primitives	Oct 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
CEIP: Combining Explicit and Implicit Priors for Reinforcement Learning with Demonstrations	Oct 18, 2022	Formreinforcement-learning	CodeCode Available	0
Rethinking Value Function Learning for Generalization in Reinforcement Learning	Oct 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
RPM: Generalizable Behaviors for Multi-Agent Reinforcement Learning	Oct 18, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Unpacking Reward Shaping: Understanding the Benefits of Reward Engineering on Sample Complexity	Oct 18, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Model Predictive Control via On-Policy Imitation Learning	Oct 17, 2022	Imitation Learningmodel	—Unverified	0
On Uncertainty in Deep State Space Models for Model-Based Reinforcement Learning	Oct 17, 2022	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Boosting Offline Reinforcement Learning via Data Rebalancing	Oct 17, 2022	D4RLOffline RL	—Unverified	0
A Generative User Simulator with GPT-based Architecture and Goal State Tracking for Reinforced Multi-Domain Dialog Systems	Oct 17, 2022	Reinforcement Learning (RL)	CodeCode Available	0
Teacher Forcing Recovers Reward Functions for Text Generation	Oct 17, 2022	regressionreinforcement-learning	CodeCode Available	1
PTDE: Personalized Training with Distilled Execution for Multi-Agent Reinforcement Learning	Oct 17, 2022	Learning-To-RankMulti-agent Reinforcement Learning	—Unverified	0
You Only Live Once: Single-Life Reinforcement Learning	Oct 17, 2022	continuous-controlContinuous Control	—Unverified	0
Towards an Interpretable Hierarchical Agent Framework using Semantic Goals	Oct 16, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Entropy Regularized Reinforcement Learning with Cascading Networks	Oct 16, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Data-Efficient Pipeline for Offline Reinforcement Learning with Limited Data	Oct 16, 2022	Model SelectionOffline RL	—Unverified	0
The Impact of Task Underspecification in Evaluating Deep Reinforcement Learning	Oct 16, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Near-Optimal Regret Bounds for Multi-batch Reinforcement Learning	Oct 15, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Revisiting the Roles of "Text" in Text Games	Oct 15, 2022	Natural Language UnderstandingPassage Retrieval	—Unverified	0
A Multilevel Reinforcement Learning Framework for PDE-based Control	Oct 15, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
G-PECNet: Towards a Generalizable Pedestrian Trajectory Prediction System	Oct 15, 2022	Autonomous VehiclesData Augmentation	CodeCode Available	0
DyFEn: Agent-Based Fee Setting in Payment Channel Networks	Oct 15, 2022	BenchmarkingDeep Reinforcement Learning	—Unverified	0
A Scalable Reinforcement Learning Approach for Attack Allocation in Swarm to Swarm Engagement Problems	Oct 15, 2022	Reinforcement Learning (RL)	—Unverified	0
A Policy-Guided Imitation Approach for Offline Reinforcement Learning	Oct 15, 2022	D4RLOffline RL	CodeCode Available	1
PI-QT-Opt: Predictive Information Improves Multi-Task Robotic Reinforcement Learning at Scale	Oct 15, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning for ConnectX	Oct 15, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
When to Update Your Model: Constrained Model-based Reinforcement Learning	Oct 15, 2022	modelModel-based Reinforcement Learning	CodeCode Available	1
Multi-trainer Interactive Reinforcement Learning System	Oct 14, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
WILD-SCAV: Benchmarking FPS Gaming AI on Unity3D-based Environments	Oct 14, 2022	Atari GamesBenchmarking	CodeCode Available	1
Skill-Based Reinforcement Learning with Intrinsic Reward Matching	Oct 14, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Robust Preference Learning for Storytelling via Contrastive Reinforcement Learning	Oct 14, 2022	Contrastive LearningLanguage Modeling	—Unverified	0
ToupleGDD: A Fine-Designed Solution of Influence Maximization by Deep Reinforcement Learning	Oct 14, 2022	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1
Model-based Safe Deep Reinforcement Learning via a Constrained Proximal Policy Optimization Algorithm	Oct 14, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 92 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified