Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10676–10700 of 15113 papers

Title	Date	Tasks	Status
Deep Reinforcement Learning with Interactive Feedback in a Human-Robot Environment	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Cognitive Radio Network Throughput Maximization with Deep Reinforcement Learning	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning and its Neuroscientific Implications	Jul 7, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Consensus Multi-Agent Reinforcement Learning for Volt-VAR Control in Power Distribution Networks	Jul 6, 2020	Deep Reinforcement LearningManagement	—Unverified
Integrating Distributed Architectures in Highly Modular RL Libraries	Jul 6, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Efficient Connected and Automated Driving System with Multi-agent Graph Reinforcement Learning	Jul 6, 2020	Decision Makingreinforcement-learning	—Unverified
Unsupervised Paraphrasing via Deep Reinforcement Learning	Jul 5, 2020	Deep Reinforcement LearningDiversity	—Unverified
Mission schedule of agile satellites based on Proximal Policy Optimization Algorithm	Jul 5, 2020	reinforcement-learningReinforcement Learning	—Unverified
Decentralized Reinforcement Learning: Global Decision-Making via Local Economic Transactions	Jul 5, 2020	Decision Makingreinforcement-learning	—Unverified
Discount Factor as a Regularizer in Reinforcement Learning	Jul 4, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Variational Policy Gradient Method for Reinforcement Learning with General Utilities	Jul 4, 2020	reinforcement-learningReinforcement Learning	—Unverified
Strategies for Using Proximal Policy Optimization in Mobile Puzzle Games	Jul 3, 2020	Reinforcement Learning (RL)	—Unverified
Temporal-Logic-Based Reward Shaping for Continuing Reinforcement Learning Tasks	Jul 3, 2020	reinforcement-learningReinforcement Learning	—Unverified
Hedging using reinforcement learning: Contextual k-Armed Bandit versus Q-learning	Jul 3, 2020	FrictionQ-Learning	—Unverified
A Unifying View of Optimism in Episodic Reinforcement Learning	Jul 3, 2020	reinforcement-learningReinforcement Learning	—Unverified
An Autonomous Free Airspace En-route Controller using Deep Reinforcement Learning Techniques	Jul 3, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Conceptual Framework for Externally-influenced Agents: An Assisted Reinforcement Learning Review	Jul 3, 2020	Decision Makingreinforcement-learning	—Unverified
Learning to search efficiently for causally near-optimal treatments	Jul 2, 2020	Causal InferenceReinforcement Learning (RL)	CodeCode Available
ε-BMC: A Bayesian Ensemble Approach to Epsilon-Greedy Exploration in Model-Free Reinforcement Learning	Jul 2, 2020	Reinforcement Learning (RL)	CodeCode Available
Decentralized Deep Reinforcement Learning for Network Level Traffic Signal Control	Jul 2, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Deep reinforcement learning driven inspection and maintenance planning under incomplete information and constraints	Jul 2, 2020	Bayesian InferenceDeep Reinforcement Learning	—Unverified
Human-centered collaborative robots with deep reinforcement learning	Jul 2, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Learning "What-if" Explanations for Sequential Decision-Making	Jul 2, 2020	counterfactualCounterfactual Reasoning	—Unverified
BOSH: Bayesian Optimization by Sampling Hierarchically	Jul 2, 2020	Bayesian Optimizationreinforcement-learning	—Unverified
Robust Inverse Reinforcement Learning under Transition Dynamics Mismatch	Jul 2, 2020	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 428 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified