Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1751–1775 of 15113 papers

Title	Date	Tasks	Status	Hype
PDDLGym: Gym Environments from PDDL Problems	Feb 15, 2020	Decision MakingOpenAI Gym	CodeCode Available	1
PDiT: Interleaving Perception and Decision-making Transformers for Deep Reinforcement Learning	Dec 26, 2023	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
PEAC: Unsupervised Pre-training for Cross-Embodiment Reinforcement Learning	May 23, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	1
Comparing Popular Simulation Environments in the Scope of Robotics and Reinforcement Learning	Mar 8, 2021	CPUreinforcement-learning	CodeCode Available	1
Combining Reinforcement Learning and Constraint Programming for Combinatorial Optimization	Jun 2, 2020	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1
Combining Modular Skills in Multitask Learning	Feb 28, 2022	Instruction Followingreinforcement-learning	CodeCode Available	1
Performance Comparison of Deep RL Algorithms for Energy Systems Optimal Scheduling	Aug 1, 2022	Deep Reinforcement Learningenergy management	CodeCode Available	1
Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning	Feb 23, 2022	D4RLOffline RL	CodeCode Available	1
Simplified Action Decoder for Deep Multi-Agent Reinforcement Learning	Dec 4, 2019	DecoderMulti-agent Reinforcement Learning	CodeCode Available	1
Combining Reinforcement Learning with Lin-Kernighan-Helsgaun Algorithm for the Traveling Salesman Problem	Dec 8, 2020	Combinatorial OptimizationQ-Learning	CodeCode Available	1
Physics-Informed Model-Based Reinforcement Learning	Dec 5, 2022	modelModel-based Reinforcement Learning	CodeCode Available	1
PIC: Permutation Invariant Critic for Multi-Agent Deep Reinforcement Learning	Oct 31, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	1
PIRLNav: Pretraining with Imitation and RL Finetuning for ObjectNav	Jan 18, 2023	Imitation LearningNavigate	CodeCode Available	1
PixL2R: Guiding Reinforcement Learning Using Natural Language by Mapping Pixels to Rewards	Jul 30, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Plan, Attend, Generate: Planning for Sequence-to-Sequence Models	Nov 28, 2017	Question GenerationQuestion-Generation	CodeCode Available	1
Plan Better Amid Conservatism: Offline Multi-Agent Reinforcement Learning with Actor Rectification	Nov 22, 2021	Continuous ControlMulti-agent Reinforcement Learning	CodeCode Available	1
Combining Deep Reinforcement Learning and Search for Imperfect-Information Games	Jul 27, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable Physics	Apr 7, 2021	Reinforcement Learning (RL)	CodeCode Available	1
Combinatorial Optimization with Policy Adaptation using Latent Space Search	Nov 13, 2023	BenchmarkingCombinatorial Optimization	CodeCode Available	1
Learning to combine primitive skills: A step towards versatile robotic manipulation	Aug 2, 2019	Data AugmentationImitation Learning	CodeCode Available	1
Podracer architectures for scalable Reinforcement Learning	Apr 13, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Automatic Curriculum Learning through Value Disagreement	Jun 17, 2020	Reinforcement Learning (RL)	CodeCode Available	1
Automatic Data Augmentation for Generalization in Deep Reinforcement Learning	Jun 23, 2020	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1
Automatic Data Augmentation for Generalization in Reinforcement Learning	Dec 1, 2021	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1
Combining Reinforcement Learning with Model Predictive Control for On-Ramp Merging	Nov 17, 2020	Autonomous DrivingModel Predictive Control	CodeCode Available	1

Show:10 25 50

← PrevPage 71 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified