Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5501–5525 of 15113 papers

Title	Date	Tasks	Status	Hype
Disentangling Epistemic and Aleatoric Uncertainty in Reinforcement Learning	Jun 3, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
KCRL: Krasovskii-Constrained Reinforcement Learning with Guaranteed Stability in Nonlinear Dynamical Systems	Jun 3, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning with Neural Radiance Fields	Jun 3, 2022	DecoderNeRF	—Unverified	0
Offline Reinforcement Learning with Causal Structured World Models	Jun 3, 2022	Model-based Reinforcement LearningOffline RL	—Unverified	0
Joint Energy Dispatch and Unit Commitment in Microgrids Based on Deep Reinforcement Learning	Jun 3, 2022	Deep Reinforcement Learningenergy management	—Unverified	0
Reincarnating Reinforcement Learning: Reusing Prior Computation to Accelerate Progress	Jun 3, 2022	Atari GamesHumanoid Control	CodeCode Available	1
Incrementality Bidding via Reinforcement Learning under Mixed and Delayed Rewards	Jun 2, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
HEX: Human-in-the-loop Explainability via Deep Reinforcement Learning	Jun 2, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Equivariant Reinforcement Learning for Quadrotor UAV	Jun 2, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
RACA: Relation-Aware Credit Assignment for Ad-Hoc Cooperation in Multi-Agent Deep Reinforcement Learning	Jun 2, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Posterior Coreset Construction with Kernelized Stein Discrepancy for Model-Based Reinforcement Learning	Jun 2, 2022	continuous-controlContinuous Control	—Unverified	0
Sample-Efficient Reinforcement Learning of Partially Observable Markov Games	Jun 2, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Offline Reinforcement Learning with Differential Privacy	Jun 2, 2022	Offline RLreinforcement-learning	—Unverified	0
When does return-conditioned supervised learning work for offline reinforcement learning?	Jun 2, 2022	D4RLreinforcement-learning	CodeCode Available	1
Reinforcement learning based parameters adaption method for particle swarm optimization	Jun 2, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
NeuralSympCheck: A Symptom Checking and Disease Diagnostic Neural Model with Logic Regularization	Jun 2, 2022	DiagnosticReinforcement Learning (RL)	CodeCode Available	1
Policy Gradient Algorithms with Monte Carlo Tree Learning for Non-Markov Decision Processes	Jun 2, 2022	Reinforcement Learning (RL)	—Unverified	0
Deep Transformer Q-Networks for Partially Observable Reinforcement Learning	Jun 2, 2022	Partially Observable Reinforcement Learningreinforcement-learning	CodeCode Available	1
Incorporating Explicit Uncertainty Estimates into Deep Offline Reinforcement Learning	Jun 2, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
A Database of Multimodal Data to Construct a Simulated Dialogue Partner with Varying Degrees of Cognitive Health	Jun 1, 2022	Dialogue ManagementManagement	—Unverified	0
RLSS: A Deep Reinforcement Learning Algorithm for Sequential Scene Generation	Jun 1, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
ResAct: Reinforcing Long-term Engagement in Sequential Recommendation with Residual Actor	Jun 1, 2022	Reinforcement Learning (RL)Sequential Recommendation	CodeCode Available	1
Model Generation with Provable Coverability for Offline Reinforcement Learning	Jun 1, 2022	Offline RLOut-of-Distribution Generalization	—Unverified	0
Neural Improvement Heuristics for Graph Combinatorial Optimization Problems	Jun 1, 2022	Combinatorial OptimizationGraph Neural Network	CodeCode Available	0
Provably Efficient Offline Multi-agent Reinforcement Learning via Strategy-wise Bonus	Jun 1, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 221 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified