Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6701–6725 of 15113 papers

Title	Date	Tasks	Status	Hype
Offline Constrained Multi-Objective Reinforcement Learning via Pessimistic Dual Value Iteration	Dec 1, 2021	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified	0
RMIX: Learning Risk-Sensitive Policies forCooperative Reinforcement Learning Agents	Dec 1, 2021	Multi-agent Reinforcement Learningquantile regression	—Unverified	0
Weighted model estimation for offline model-based reinforcement learning	Dec 1, 2021	Density Ratio Estimationmodel	—Unverified	0
Regularized Softmax Deep Multi-Agent Q-Learning	Dec 1, 2021	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	1
Offline Model-based Adaptable Policy Learning	Dec 1, 2021	Decision Makingmodel	CodeCode Available	1
BooVI: Provably Efficient Bootstrapped Value Iteration	Dec 1, 2021	Efficient ExplorationReinforcement Learning (RL)	—Unverified	0
CO-PILOT: COllaborative Planning and reInforcement Learning On sub-Task curriculum	Dec 1, 2021	continuous-controlContinuous Control	CodeCode Available	0
Learning Tree Interpretation from Object Representation for Deep Reinforcement Learning	Dec 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Curriculum Offline Imitating Learning	Dec 1, 2021	continuous-controlContinuous Control	—Unverified	0
BCORLE(): An Offline Reinforcement Learning and Evaluation Framework for Coupons Allocation in E-commerce Market	Dec 1, 2021	Off-policy evaluationreinforcement-learning	CodeCode Available	1
Counterexample Guided RL Policy Refinement Using Bayesian Optimization	Dec 1, 2021	Bayesian OptimizationReinforcement Learning (RL)	CodeCode Available	0
Distributionally Robust Imitation Learning	Dec 1, 2021	Imitation Learningreinforcement-learning	—Unverified	0
Explicable Reward Design for Reinforcement Learning Agents	Dec 1, 2021	Informativenessreinforcement-learning	CodeCode Available	0
EDGE: Explaining Deep Reinforcement Learning Policies	Dec 1, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
Cross-modal Domain Adaptation for Cost-Efficient Visual Reinforcement Learning	Dec 1, 2021	Domain AdaptationMuJoCo	CodeCode Available	1
Energy-Efficient Design for a NOMA assisted STAR-RIS Network with Deep Reinforcement Learning	Nov 30, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Risk-based implementation of COLREGs for autonomous surface vehicles using deep reinforcement learning	Nov 30, 2021	Collision AvoidanceDeep Reinforcement Learning	—Unverified	0
Model-Free μ Synthesis via Adversarial Reinforcement Learning	Nov 30, 2021	modelreinforcement-learning	—Unverified	0
The Power of Communication in a Distributed Multi-Agent System	Nov 30, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
MAMRL: Exploiting Multi-agent Meta Reinforcement Learning in WAN Traffic Engineering	Nov 30, 2021	Decision MakingMeta-Learning	—Unverified	0
Continuous Control With Ensemble Deep Deterministic Policy Gradients	Nov 30, 2021	continuous-controlContinuous Control	CodeCode Available	0
DeepCQ+: Robust and Scalable Routing with Multi-Agent Deep Reinforcement Learning for Highly Dynamic Networks	Nov 29, 2021	Deep Reinforcement LearningQ-Learning	—Unverified	0
Multi-UAV Conflict Resolution with Graph Convolutional Reinforcement Learning	Nov 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning Algorithm for Traffic Steering in Heterogeneous Network	Nov 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Robust On-Policy Sampling for Data-Efficient Policy Evaluation in Reinforcement Learning	Nov 29, 2021	Offline RLreinforcement-learning	CodeCode Available	0

Show:10 25 50

← PrevPage 269 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified