Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6751–6800 of 15113 papers

Title	Date	Tasks	Status
Beyond Value: CHECKLIST for Testing Inferences in Planning-Based RL	Jun 4, 2022	Reinforcement Learning (RL)	—Unverified
Reward Poisoning Attacks on Offline Multi-Agent Reinforcement Learning	Jun 4, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
MACC: Cross-Layer Multi-Agent Congestion Control with Deep Reinforcement Learning	Jun 4, 2022	Deep Reinforcement LearningManagement	—Unverified
Reinforcement Learning with Neural Radiance Fields	Jun 3, 2022	DecoderNeRF	—Unverified
Offline Reinforcement Learning with Causal Structured World Models	Jun 3, 2022	Model-based Reinforcement LearningOffline RL	—Unverified
Disentangling Epistemic and Aleatoric Uncertainty in Reinforcement Learning	Jun 3, 2022	reinforcement-learningReinforcement Learning	—Unverified
A Deep Reinforcement Learning Framework For Column Generation	Jun 3, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available
Joint Energy Dispatch and Unit Commitment in Microgrids Based on Deep Reinforcement Learning	Jun 3, 2022	Deep Reinforcement Learningenergy management	—Unverified
KCRL: Krasovskii-Constrained Reinforcement Learning with Guaranteed Stability in Nonlinear Dynamical Systems	Jun 3, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Equivariant Reinforcement Learning for Quadrotor UAV	Jun 2, 2022	reinforcement-learningReinforcement Learning	—Unverified
Incorporating Explicit Uncertainty Estimates into Deep Offline Reinforcement Learning	Jun 2, 2022	reinforcement-learningReinforcement Learning	—Unverified
Incrementality Bidding via Reinforcement Learning under Mixed and Delayed Rewards	Jun 2, 2022	reinforcement-learningReinforcement Learning	—Unverified
HEX: Human-in-the-loop Explainability via Deep Reinforcement Learning	Jun 2, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Sample-Efficient Reinforcement Learning of Partially Observable Markov Games	Jun 2, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Policy Gradient Algorithms with Monte Carlo Tree Learning for Non-Markov Decision Processes	Jun 2, 2022	Reinforcement Learning (RL)	—Unverified
Posterior Coreset Construction with Kernelized Stein Discrepancy for Model-Based Reinforcement Learning	Jun 2, 2022	continuous-controlContinuous Control	—Unverified
RACA: Relation-Aware Credit Assignment for Ad-Hoc Cooperation in Multi-Agent Deep Reinforcement Learning	Jun 2, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Reinforcement learning based parameters adaption method for particle swarm optimization	Jun 2, 2022	reinforcement-learningReinforcement Learning	—Unverified
Offline Reinforcement Learning with Differential Privacy	Jun 2, 2022	Offline RLreinforcement-learning	—Unverified
RLSS: A Deep Reinforcement Learning Algorithm for Sequential Scene Generation	Jun 1, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
On Gap-dependent Bounds for Offline Reinforcement Learning	Jun 1, 2022	reinforcement-learningReinforcement Learning	—Unverified
Predecessor Features	Jun 1, 2022	reinforcement-learningReinforcement Learning	—Unverified
Model Generation with Provable Coverability for Offline Reinforcement Learning	Jun 1, 2022	Offline RLOut-of-Distribution Generalization	—Unverified
Provably Efficient Offline Multi-agent Reinforcement Learning via Strategy-wise Bonus	Jun 1, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Provably Efficient Lifelong Reinforcement Learning with Linear Function Approximation	Jun 1, 2022	4kLifelong learning	—Unverified
Neural Improvement Heuristics for Graph Combinatorial Optimization Problems	Jun 1, 2022	Combinatorial OptimizationGraph Neural Network	CodeCode Available
The Phenomenon of Policy Churn	Jun 1, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
DM^2: Decentralized Multi-Agent Reinforcement Learning for Distribution Matching	Jun 1, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Efficient Scheduling of Data Augmentation for Deep Reinforcement Learning	Jun 1, 2022	Data AugmentationDeep Reinforcement Learning	—Unverified
Byzantine-Robust Online and Offline Distributed Reinforcement Learning	Jun 1, 2022	reinforcement-learningReinforcement Learning	—Unverified
Know Your Boundaries: The Necessity of Explicit Behavioral Cloning in Offline RL	Jun 1, 2022	D4RLOffline RL	—Unverified
A Database of Multimodal Data to Construct a Simulated Dialogue Partner with Varying Degrees of Cognitive Health	Jun 1, 2022	Dialogue ManagementManagement	—Unverified
A Meta Reinforcement Learning Approach for Predictive Autoscaling in the Cloud	May 31, 2022	CPUDecision Making	CodeCode Available
A Mixture-of-Expert Approach to RL-based Dialogue Management	May 31, 2022	AttributeDialogue Management	—Unverified
Lessons Learned from Data-Driven Building Control Experiments: Contrasting Gaussian Process-based MPC, Bilevel DeePC, and Deep Reinforcement Learning	May 31, 2022	Deep Reinforcement LearningGaussian Processes	—Unverified
Graph Backup: Data Efficient Backup Exploiting Markovian Transitions	May 31, 2022	Atari Gamescounterfactual	CodeCode Available
k-Means Maximum Entropy Exploration	May 31, 2022	Density Estimationreinforcement-learning	—Unverified
Provable General Function Class Representation Learning in Multitask Bandits and MDPs	May 31, 2022	Multi-Armed BanditsReinforcement Learning (RL)	—Unverified
One Policy is Enough: Parallel Exploration with a Single Policy is Near-Optimal for Reward-Free Reinforcement Learning	May 31, 2022	Reinforcement Learning (RL)	—Unverified
Multi-Agent Learning of Numerical Methods for Hyperbolic PDEs with Factored Dec-MDP	May 31, 2022	Decision Makingreinforcement-learning	—Unverified
Timing is Everything: Learning to Act Selectively with Costly Actions and Budgetary Constraints	May 31, 2022	Reinforcement Learning (RL)	—Unverified
Robust Longitudinal Control for Vehicular Autonomous Platoons Using Deep Reinforcement Learning	May 31, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Sample-Efficient, Exploration-Based Policy Optimisation for Routing Problems	May 31, 2022	Efficient Explorationreinforcement-learning	—Unverified
Nearly Minimax Optimal Offline Reinforcement Learning with Linear Function Approximation: Single-Agent MDP and Markov Game	May 31, 2022	Offline RLReinforcement Learning (RL)	—Unverified
Non-Markovian Reward Modelling from Trajectory Labels via Interpretable Multiple Instance Learning	May 30, 2022	Multiple Instance LearningReinforcement Learning (RL)	CodeCode Available
Residual Q-Networks for Value Function Factorizing in Multi-Agent Reinforcement Learning	May 30, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Quantum Multi-Armed Bandits and Stochastic Linear Bandits Enjoy Logarithmic Regrets	May 30, 2022	Multi-Armed Banditsreinforcement-learning	—Unverified
Reinforcement Learning with a Terminator	May 30, 2022	Autonomous Drivingreinforcement-learning	CodeCode Available
SEREN: Knowing When to Explore and When to Exploit	May 30, 2022	MuJoCoReinforcement Learning (RL)	—Unverified
Stock Trading Optimization through Model-based Reinforcement Learning with Resistance Support Relative Strength	May 30, 2022	Decision MakingModel-based Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 136 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified