Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 15113 papers

Title	Date	Tasks	Status	Hype
De novo PROTAC design using graph-based deep generative models	Nov 4, 2022	Reinforcement Learning (RL)	CodeCode Available	1
Scalable Multi-Agent Reinforcement Learning through Intelligent Information Aggregation	Nov 3, 2022	Collision AvoidanceGraph Neural Network	CodeCode Available	1
Synthesis of separation processes with reinforcement learning	Nov 3, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Learning safety in model-based Reinforcement Learning using MPC and Gaussian Processes	Nov 3, 2022	Gaussian ProcessesModel-based Reinforcement Learning	CodeCode Available	1
Multi-Agent Reinforcement Learning for Adaptive Mesh Refinement	Nov 2, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Causal Counterfactuals for Improving the Robustness of Reinforcement Learning	Nov 2, 2022	Causal Inferencereinforcement-learning	CodeCode Available	1
Spatial-temporal recurrent reinforcement learning for autonomous ships	Nov 2, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Online Control of Adaptive Large Neighborhood Search using Deep Reinforcement Learning	Nov 1, 2022	Bayesian OptimizationCombinatorial Optimization	CodeCode Available	1
RLET: A Reinforcement Learning Based Approach for Explainable QA with Entailment Trees	Oct 31, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Agent-Controller Representations: Principled Offline RL with Rich Exogenous Information	Oct 31, 2022	Offline RLReinforcement Learning (RL)	CodeCode Available	1
DeFIX: Detecting and Fixing Failure Scenarios with Reinforcement Learning in Imitation Learning Based Autonomous Driving	Oct 29, 2022	Autonomous DrivingCARLA MAP Leaderboard	CodeCode Available	1
BIMRL: Brain Inspired Meta Reinforcement Learning	Oct 29, 2022	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1
Self-Improving Safety Performance of Reinforcement Learning Based Driving with Black-Box Verification Algorithms	Oct 29, 2022	Autonomous DrivingDiversity	CodeCode Available	1
Language Control Diffusion: Efficiently Scaling through Space, Time, and Tasks	Oct 27, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Provable Safe Reinforcement Learning with Binary Feedback	Oct 26, 2022	Active Learningreinforcement-learning	CodeCode Available	1
Low-Rank Modular Reinforcement Learning via Muscle Synergy	Oct 26, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
ERL-Re^2: Efficient Evolutionary Reinforcement Learning with Shared State Representation and Individual Policy Representation	Oct 26, 2022	continuous-controlContinuous Control	CodeCode Available	1
Teal: Learning-Accelerated Optimization of WAN Traffic Engineering	Oct 25, 2022	Graph Neural NetworkMulti-agent Reinforcement Learning	CodeCode Available	1
Sim-to-Real via Sim-to-Seg: End-to-end Off-road Autonomous Driving Without Real Data	Oct 25, 2022	Autonomous DrivingGPU	CodeCode Available	1
Adaptive Behavior Cloning Regularization for Stable Offline-to-Online Reinforcement Learning	Oct 25, 2022	D4RLOffline RL	CodeCode Available	1
Symbolic Distillation for Learned TCP Congestion Control	Oct 24, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Evaluating Long-Term Memory in 3D Mazes	Oct 24, 2022	Navigatereinforcement-learning	CodeCode Available	1
Multi-Agent Path Finding via Tree LSTM	Oct 24, 2022	Multi-Agent Path Findingreinforcement-learning	CodeCode Available	1
Energy Pricing in P2P Energy Systems Using Reinforcement Learning	Oct 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Avalon: A Benchmark for RL Generalization Using Procedurally Generated Worlds	Oct 24, 2022	Deep Reinforcement LearningNavigate	CodeCode Available	1
ADLight: A Universal Approach of Traffic Signal Control with Augmented Data Using Reinforcement Learning	Oct 24, 2022	Data Augmentationreinforcement-learning	CodeCode Available	1
PaCo: Parameter-Compositional Multi-Task Reinforcement Learning	Oct 21, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Hypernetworks in Meta-Reinforcement Learning	Oct 20, 2022	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1
MoCoDA: Model-based Counterfactual Data Augmentation	Oct 20, 2022	counterfactualData Augmentation	CodeCode Available	1
RMBench: Benchmarking Deep Reinforcement Learning for Robotic Manipulator Control	Oct 20, 2022	BenchmarkingData Augmentation	CodeCode Available	1
On the Feasibility of Cross-Task Transfer with Model-Based Reinforcement Learning	Oct 19, 2022	Atari Games 100kModel-based Reinforcement Learning	CodeCode Available	1
Rethinking Value Function Learning for Generalization in Reinforcement Learning	Oct 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Curriculum Reinforcement Learning using Optimal Transport via Gradual Domain Adaptation	Oct 18, 2022	Domain Adaptationreinforcement-learning	CodeCode Available	1
Deep Black-Box Reinforcement Learning with Movement Primitives	Oct 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
On Uncertainty in Deep State Space Models for Model-Based Reinforcement Learning	Oct 17, 2022	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Teacher Forcing Recovers Reward Functions for Text Generation	Oct 17, 2022	regressionreinforcement-learning	CodeCode Available	1
A Policy-Guided Imitation Approach for Offline Reinforcement Learning	Oct 15, 2022	D4RLOffline RL	CodeCode Available	1
When to Update Your Model: Constrained Model-based Reinforcement Learning	Oct 15, 2022	modelModel-based Reinforcement Learning	CodeCode Available	1
Model-based Safe Deep Reinforcement Learning via a Constrained Proximal Policy Optimization Algorithm	Oct 14, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Safe Model-Based Reinforcement Learning with an Uncertainty-Aware Reachability Certificate	Oct 14, 2022	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Skill-Based Reinforcement Learning with Intrinsic Reward Matching	Oct 14, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Frame Mining: a Free Lunch for Learning Robotic Manipulation from 3D Point Clouds	Oct 14, 2022	3D Point Cloud Reinforcement LearningImitation Learning	CodeCode Available	1
WILD-SCAV: Benchmarking FPS Gaming AI on Unity3D-based Environments	Oct 14, 2022	Atari GamesBenchmarking	CodeCode Available	1
ToupleGDD: A Fine-Designed Solution of Influence Maximization by Deep Reinforcement Learning	Oct 14, 2022	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1
Abstract-to-Executable Trajectory Translation for One-Shot Task Generalization	Oct 14, 2022	Few-Shot Imitation LearningReinforcement Learning (RL)	CodeCode Available	1
A Mixture of Surprises for Unsupervised Reinforcement Learning	Oct 13, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Sustainable Online Reinforcement Learning for Auto-bidding	Oct 13, 2022	Q-Learningreinforcement-learning	CodeCode Available	1
Visual Reinforcement Learning with Self-Supervised 3D Representations	Oct 13, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Towards Trustworthy Automatic Diagnosis Systems by Emulating Doctors' Reasoning with Deep Reinforcement Learning	Oct 13, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Multi-agent Dynamic Algorithm Configuration	Oct 13, 2022	Multi-Armed BanditsReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 19 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified