Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8876–8900 of 15113 papers

Title	Date	Tasks	Status	Hype
Throughput Optimization for Grant-Free Multiple Access With Multiagent Deep Reinforcement Learning	Feb 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Variation-resistant Q-learning: Controlling and Utilizing Estimation Bias in Reinforcement Learning for Better Performance	Feb 1, 2021	Q-Learningreinforcement-learning	CodeCode Available	0
NeoRL: A Near Real-World Benchmark for Offline Reinforcement Learning	Feb 1, 2021	Offline RLreinforcement-learning	CodeCode Available	1
Risk Aware and Multi-Objective Decision Making with Distributional Monte Carlo Tree Search	Feb 1, 2021	Decision MakingMulti-Objective Reinforcement Learning	—Unverified	0
Multi-Agent Reinforcement Learning with Temporal Logic Specifications	Feb 1, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Interpretable Reinforcement Learning Inspired by Piaget's Theory of Cognitive Development	Feb 1, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Hybrid Beamforming for mmWave MU-MISO Systems Exploiting Multi-agent Deep Reinforcement Learning	Feb 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Hybrid Information-driven Multi-agent Reinforcement Learning	Feb 1, 2021	ManagementMulti-agent Reinforcement Learning	—Unverified	0
Bellman Eluder Dimension: New Rich Classes of RL Problems, and Sample-Efficient Algorithms	Feb 1, 2021	Reinforcement Learning (RL)	—Unverified	0
A Secure Learning Control Strategy via Dynamic Camouflaging for Unknown Dynamical Systems under Attacks	Feb 1, 2021	Misinformationreinforcement-learning	—Unverified	0
Improving Human Decision-Making by Discovering Efficient Strategies for Hierarchical Planning	Jan 31, 2021	Computational EfficiencyDecision Making	—Unverified	0
Fast Rates for the Regret of Offline Reinforcement Learning	Jan 31, 2021	Decision Makingreinforcement-learning	—Unverified	0
Contextualized Rewriting for Text Summarization	Jan 31, 2021	Extractive Summarizationreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning Aided Monte Carlo Tree Search for MIMO Detection	Jan 30, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Deep Reinforcement Learning-Based Product Recommender for Online Advertising	Jan 30, 2021	Deep Reinforcement LearningRecommendation Systems	—Unverified	0
On the Stability of Random Matrix Product with Markovian Noise: Application to Linear Stochastic Approximation and TD Learning	Jan 30, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Skills to Navigate without a Master: A Sequential Multi-Policy Reinforcement Learning Algorithm	Jan 30, 2021	Autonomous NavigationHierarchical Reinforcement Learning	—Unverified	0
Policy Mirror Descent for Reinforcement Learning: Linear Convergence, New Sampling Complexity, and Generalized Problem Classes	Jan 30, 2021	Reinforcement Learning (RL)	—Unverified	0
Meta-Reinforcement Learning for Reliable Communication in THz/VLC Wireless VR Networks	Jan 29, 2021	Meta-LearningMeta Reinforcement Learning	CodeCode Available	0
Thermal Control of Laser Powder Bed Fusion Using Deep Reinforcement Learning	Jan 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Scalable Voltage Control using Structure-Driven Hierarchical Deep Reinforcement Learning	Jan 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning for Freight Booking Control Problems	Jan 29, 2021	BIG-bench Machine LearningDecision Making	—Unverified	0
Challenges for Using Impact Regularizers to Avoid Negative Side Effects	Jan 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Counterfactual State Explanations for Reinforcement Learning Agents via Generative Deep Learning	Jan 29, 2021	counterfactualDeep Reinforcement Learning	CodeCode Available	0
Learning-based vs Model-free Adaptive Control of a MAV under Wind Gust	Jan 29, 2021	Deep Reinforcement LearningOpen-Ended Question Answering	—Unverified	0

Show:10 25 50

← PrevPage 356 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified