Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6701–6750 of 15113 papers

Title	Date	Tasks	Status	Hype
Offline Constrained Multi-Objective Reinforcement Learning via Pessimistic Dual Value Iteration	Dec 1, 2021	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified	0
RMIX: Learning Risk-Sensitive Policies forCooperative Reinforcement Learning Agents	Dec 1, 2021	Multi-agent Reinforcement Learningquantile regression	—Unverified	0
Weighted model estimation for offline model-based reinforcement learning	Dec 1, 2021	Density Ratio Estimationmodel	—Unverified	0
Regularized Softmax Deep Multi-Agent Q-Learning	Dec 1, 2021	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	1
Offline Model-based Adaptable Policy Learning	Dec 1, 2021	Decision Makingmodel	CodeCode Available	1
BooVI: Provably Efficient Bootstrapped Value Iteration	Dec 1, 2021	Efficient ExplorationReinforcement Learning (RL)	—Unverified	0
CO-PILOT: COllaborative Planning and reInforcement Learning On sub-Task curriculum	Dec 1, 2021	continuous-controlContinuous Control	CodeCode Available	0
Learning Tree Interpretation from Object Representation for Deep Reinforcement Learning	Dec 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Curriculum Offline Imitating Learning	Dec 1, 2021	continuous-controlContinuous Control	—Unverified	0
BCORLE(): An Offline Reinforcement Learning and Evaluation Framework for Coupons Allocation in E-commerce Market	Dec 1, 2021	Off-policy evaluationreinforcement-learning	CodeCode Available	1
Counterexample Guided RL Policy Refinement Using Bayesian Optimization	Dec 1, 2021	Bayesian OptimizationReinforcement Learning (RL)	CodeCode Available	0
Distributionally Robust Imitation Learning	Dec 1, 2021	Imitation Learningreinforcement-learning	—Unverified	0
Explicable Reward Design for Reinforcement Learning Agents	Dec 1, 2021	Informativenessreinforcement-learning	CodeCode Available	0
EDGE: Explaining Deep Reinforcement Learning Policies	Dec 1, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
Cross-modal Domain Adaptation for Cost-Efficient Visual Reinforcement Learning	Dec 1, 2021	Domain AdaptationMuJoCo	CodeCode Available	1
Energy-Efficient Design for a NOMA assisted STAR-RIS Network with Deep Reinforcement Learning	Nov 30, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Risk-based implementation of COLREGs for autonomous surface vehicles using deep reinforcement learning	Nov 30, 2021	Collision AvoidanceDeep Reinforcement Learning	—Unverified	0
Model-Free μ Synthesis via Adversarial Reinforcement Learning	Nov 30, 2021	modelreinforcement-learning	—Unverified	0
The Power of Communication in a Distributed Multi-Agent System	Nov 30, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
MAMRL: Exploiting Multi-agent Meta Reinforcement Learning in WAN Traffic Engineering	Nov 30, 2021	Decision MakingMeta-Learning	—Unverified	0
Continuous Control With Ensemble Deep Deterministic Policy Gradients	Nov 30, 2021	continuous-controlContinuous Control	CodeCode Available	0
DeepCQ+: Robust and Scalable Routing with Multi-Agent Deep Reinforcement Learning for Highly Dynamic Networks	Nov 29, 2021	Deep Reinforcement LearningQ-Learning	—Unverified	0
Multi-UAV Conflict Resolution with Graph Convolutional Reinforcement Learning	Nov 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning Algorithm for Traffic Steering in Heterogeneous Network	Nov 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Robust On-Policy Sampling for Data-Efficient Policy Evaluation in Reinforcement Learning	Nov 29, 2021	Offline RLreinforcement-learning	CodeCode Available	0
Model-Based End-to-End Learning for WDM Systems With Transceiver Hardware Impairments	Nov 29, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Pessimistic Model Selection for Offline Deep Reinforcement Learning	Nov 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
How Can Creativity Occur in Multi-Agent Systems?	Nov 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Final Adaptation Reinforcement Learning for N-Player Games	Nov 29, 2021	Board GamesQ-Learning	—Unverified	0
Improving Zero-shot Generalization in Offline Reinforcement Learning using Generalized Similarity Functions	Nov 29, 2021	Contrastive LearningDecision Making	—Unverified	0
Count-Based Temperature Scheduling for Maximum Entropy Reinforcement Learning	Nov 28, 2021	Q-Learningreinforcement-learning	—Unverified	0
Deep Q-Learning based Reinforcement Learning Approach for Network Intrusion Detection	Nov 27, 2021	Intrusion DetectionNetwork Intrusion Detection	CodeCode Available	0
Learning Long-Term Reward Redistribution via Randomized Return Decomposition	Nov 26, 2021	Attributereinforcement-learning	CodeCode Available	1
Reinforcement Explanation Learning	Nov 26, 2021	image-classificationImage Classification	—Unverified	0
Measuring Data Quality for Dataset Selection in Offline Reinforcement Learning	Nov 26, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Real-world challenges for multi-agent reinforcement learning in grid-interactive buildings	Nov 25, 2021	Model Predictive ControlMulti-agent Reinforcement Learning	—Unverified	0
Towards Modularity Optimization Using Reinforcement Learning to Community Detection in Dynamic Social Networks	Nov 25, 2021	Community Detectionreinforcement-learning	—Unverified	0
DeepWiVe: Deep-Learning-Aided Wireless Video Transmission	Nov 25, 2021	Deep LearningMS-SSIM	—Unverified	0
A Comparative Analysis of Machine Learning Techniques for IoT Intrusion Detection	Nov 25, 2021	Anomaly DetectionBIG-bench Machine Learning	—Unverified	0
Distributed Policy Gradient with Variance Reduction in Multi-Agent Reinforcement Learning	Nov 25, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Learn Zero-Constraint-Violation Policy in Model-Free Constrained Reinforcement Learning	Nov 25, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Learning State Representations via Retracing in Reinforcement Learning	Nov 24, 2021	continuous-controlContinuous Control	CodeCode Available	0
How does AI play football? An analysis of RL and real-world football strategies	Nov 24, 2021	Reinforcement Learning (RL)	—Unverified	0
GDI: Rethinking What Makes Reinforcement Learning Different from Supervised Learning	Nov 24, 2021	Atari GamesDeep Reinforcement Learning	—Unverified	0
A note on stabilizing reinforcement learning	Nov 24, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Adaptively Calibrated Critic Estimates for Deep Reinforcement Learning	Nov 24, 2021	continuous-controlContinuous Control	CodeCode Available	0
A Review for Deep Reinforcement Learning in Atari: Benchmarks, Challenges, and Solutions	Nov 24, 2021	Atari GamesDeep Reinforcement Learning	—Unverified	0
Learning to Schedule Heuristics for the Simultaneous Stochastic Optimization of Mining Complexes	Nov 24, 2021	Combinatorial OptimizationReinforcement Learning (RL)	—Unverified	0
Application of Multi-Agent Reinforcement Learning for Battery Management in Renewable Mini-Grids	Nov 24, 2021	ManagementMulti-agent Reinforcement Learning	—Unverified	0
SatNet: A Benchmark for Satellite Scheduling Optimization	Nov 24, 2021	Combinatorial OptimizationEvolutionary Algorithms	—Unverified	0

Show:10 25 50

← PrevPage 135 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified