Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6451–6500 of 15113 papers

Title	Date	Tasks	Status	Hype
Automated Reinforcement Learning (AutoRL): A Survey and Open Problems	Jan 11, 2022	AutoMLMeta-Learning	—Unverified	0
Benchmarking Deep Reinforcement Learning Algorithms for Vision-based Robotics	Jan 11, 2022	BenchmarkingDeep Reinforcement Learning	—Unverified	0
Active Reinforcement Learning -- A Roadmap Towards Curious Classifier Systems for Self-Adaptation	Jan 11, 2022	Active LearningAnomaly Detection	—Unverified	0
In Defense of the Unitary Scalarization for Deep Multi-Task Learning	Jan 11, 2022	Multi-Task LearningReinforcement Learning (RL)	CodeCode Available	1
STIR^2: Reward Relabelling for combined Reinforcement and Imitation Learning on sparse-reward tasks	Jan 11, 2022	Autonomous DrivingDecision Making	—Unverified	0
Pavlovian Signalling with General Value Functions in Agent-Agent Temporal Decision Making	Jan 11, 2022	Decision Makingreinforcement-learning	—Unverified	0
Distributed Cooperative Multi-Agent Reinforcement Learning with Directed Coordination Graph	Jan 10, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
State of the Art of User Simulation approaches for conversational information retrieval	Jan 10, 2022	Decision MakingInformation Retrieval	—Unverified	0
Opportunities of Hybrid Model-based Reinforcement Learning for Cell Therapy Manufacturing Process Control	Jan 10, 2022	Decision MakingModel-based Reinforcement Learning	—Unverified	0
When is Offline Two-Player Zero-Sum Markov Game Solvable?	Jan 10, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Verified Probabilistic Policies for Deep Reinforcement Learning	Jan 10, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
A Multi-agent Reinforcement Learning Approach for Efficient Client Selection in Federated Learning	Jan 9, 2022	Federated LearningMulti-agent Reinforcement Learning	—Unverified	0
Assessing Policy, Loss and Planning Combinations in Reinforcement Learning using a New Modular Architecture	Jan 8, 2022	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified	0
Mirror Learning: A Unifying Framework of Policy Optimisation	Jan 7, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Neural Network Optimization for Reinforcement Learning Tasks Using Sparse Computations	Jan 7, 2022	Network Pruningreinforcement-learning	—Unverified	0
Offline Reinforcement Learning for Road Traffic Control	Jan 7, 2022	Offline RLreinforcement-learning	—Unverified	0
SABLAS: Learning Safe Control for Black-box Dynamical Systems	Jan 6, 2022	Reinforcement Learning (RL)	CodeCode Available	1
Combining Reinforcement Learning and Inverse Reinforcement Learning for Asset Allocation Recommendations	Jan 6, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Sample Efficient Deep Reinforcement Learning via Uncertainty Estimation	Jan 5, 2022	continuous-controlContinuous Control	CodeCode Available	1
Offsetting Unequal Competition through RL-assisted Incentive Schemes	Jan 5, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Using Simulation Optimization to Improve Zero-shot Policy Transfer of Quadrotors	Jan 4, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Deep Reinforcement Learning, a textbook	Jan 4, 2022	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Deep Learning-based Predictive Control of Battery Management for Frequency Regulation	Jan 4, 2022	ManagementModel Predictive Control	CodeCode Available	0
Learning Complex Spatial Behaviours in ABM: An Experimental Observational Study	Jan 4, 2022	Decision MakingReinforcement Learning (RL)	—Unverified	0
Analyzing Micro-Founded General Equilibrium Models with Many Agents using Deep Reinforcement Learning	Jan 3, 2022	Deep Reinforcement LearningGPU	—Unverified	0
A Deeper Understanding of State-Based Critics in Multi-Agent Reinforcement Learning	Jan 3, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Execute Order 66: Targeted Data Poisoning for Reinforcement Learning	Jan 3, 2022	Atari GamesData Poisoning	—Unverified	0
Actor-Critic Network for Q&A in an Adversarial Environment	Jan 3, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Hybrid intelligence for dynamic job-shop scheduling with deep reinforcement learning and attention mechanism	Jan 3, 2022	Deep Reinforcement LearningGraph Representation Learning	CodeCode Available	1
Robust Algorithmic Collusion	Jan 2, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Toward Causal-Aware RL: State-Wise Action-Refined Temporal Difference	Jan 2, 2022	continuous-controlContinuous Control	CodeCode Available	0
Reinforcement Learning for Task Specifications with Action-Constraints	Jan 2, 2022	Q-Learningreinforcement-learning	—Unverified	0
Temporal Complementarity-Guided Reinforcement Learning for Image-to-Video Person Re-Identification	Jan 1, 2022	Deep Reinforcement LearningImage-To-Video Person Re-Identification	—Unverified	0
Symmetry-Aware Neural Architecture for Embodied Visual Exploration	Jan 1, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Joint Learning-Based Stabilization of Multiple Unknown Linear Systems	Jan 1, 2022	Reinforcement Learning (RL)	—Unverified	0
A Surrogate-Assisted Controller for Expensive Evolutionary Reinforcement Learning	Jan 1, 2022	continuous-controlContinuous Control	—Unverified	0
Toward Pareto Efficient Fairness-Utility Trade-off inRecommendation through Reinforcement Learning	Jan 1, 2022	FairnessMulti-Objective Reinforcement Learning	—Unverified	0
Operator Deep Q-Learning: Zero-Shot Reward Transferring in Reinforcement Learning	Jan 1, 2022	Q-Learningreinforcement-learning	—Unverified	0
Transfer RL across Observation Feature Spaces via Model-Based Regularization	Jan 1, 2022	Reinforcement Learning (RL)	—Unverified	0
Stochastic convex optimization for provably efficient apprenticeship learning	Dec 31, 2021	Imitation Learningreinforcement-learning	—Unverified	0
Using Graph-Aware Reinforcement Learning to Identify Winning Strategies in Diplomacy Games (Student Abstract)	Dec 31, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Single-Shot Pruning for Offline Reinforcement Learning	Dec 31, 2021	continuous-controlContinuous Control	—Unverified	0
Robust Entropy-regularized Markov Decision Processes	Dec 31, 2021	Imitation LearningReinforcement Learning (RL)	—Unverified	0
SimSR: Simple Distance-based State Representation for Deep Reinforcement Learning	Dec 31, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning	Dec 31, 2021	Atari GamesMeta Reinforcement Learning	CodeCode Available	0
Importance of Empirical Sample Complexity Analysis for Offline Reinforcement Learning	Dec 31, 2021	Offline RLreinforcement-learning	—Unverified	0
Stability-Preserving Automatic Tuning of PID Control with Reinforcement Learning	Dec 30, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Reversible Upper Confidence Bound Algorithm to Generate Diverse Optimized Candidates	Dec 30, 2021	Drug Discoveryreinforcement-learning	—Unverified	0
Multi-Agent Reinforcement Learning via Adaptive Kalman Temporal Difference and Successor Representation	Dec 30, 2021	Multi-agent Reinforcement LearningOpenAI Gym	—Unverified	0
Constructing a Good Behavior Basis for Transfer using Generalized Policy Updates	Dec 30, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0

Show:10 25 50

← PrevPage 130 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified