Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10226–10250 of 15113 papers

Title	Date	Tasks	Status	Hype
Discourse Coherence, Reference Grounding and Goal Oriented Dialogue	Jul 8, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A Natural Actor-Critic Algorithm with Downside Risk Constraints	Jul 8, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Auto-MAP: A DQN Framework for Exploring Distributed Execution Plans for DNN Workloads	Jul 8, 2020	Deep LearningEfficient Exploration	—Unverified	0
Responsive Safety in Reinforcement Learning by PID Lagrangian Methods	Jul 8, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
A deep reinforcement learning model based on deterministic policy gradient for collective neural crest cell migration	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning with Interactive Feedback in a Human-Robot Environment	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning and its Neuroscientific Implications	Jul 7, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Cognitive Radio Network Throughput Maximization with Deep Reinforcement Learning	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Necessary and Sufficient Conditions for Inverse Reinforcement Learning of Bayesian Stopping Time Problems	Jul 7, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Towards a practical measure of interference for reinforcement learning	Jul 7, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Predictive Maintenance for Edge-Based Sensor Networks: A Deep Reinforcement Learning Approach	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Near-Optimal Provable Uniform Convergence in Offline Policy Evaluation for Reinforcement Learning	Jul 7, 2020	Offline RLreinforcement-learning	—Unverified	0
Provably Safe PAC-MDP Exploration Using Analogies	Jul 7, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Sharp Analysis of Smoothed Bellman Error Embedding	Jul 7, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
The LoCA Regret: A Consistent Metric to Evaluate Model-Based Behavior in Reinforcement Learning	Jul 7, 2020	General Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	0
Efficient Connected and Automated Driving System with Multi-agent Graph Reinforcement Learning	Jul 6, 2020	Decision Makingreinforcement-learning	—Unverified	0
Consensus Multi-Agent Reinforcement Learning for Volt-VAR Control in Power Distribution Networks	Jul 6, 2020	Deep Reinforcement LearningManagement	—Unverified	0
Enhancing SAT solvers with glue variable predictions	Jul 6, 2020	CPUGPU	CodeCode Available	1
LFQ: Online Learning of Per-flow Queuing Policies using Deep Reinforcement Learning	Jul 6, 2020	Deep Reinforcement LearningFairness	CodeCode Available	1
Counterfactual Data Augmentation using Locally Factored Dynamics	Jul 6, 2020	counterfactualData Augmentation	CodeCode Available	1
Learning Implicit Credit Assignment for Cooperative Multi-Agent Reinforcement Learning	Jul 6, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Integrating Distributed Architectures in Highly Modular RL Libraries	Jul 6, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Maximum Entropy Gain Exploration for Long Horizon Multi-goal Reinforcement Learning	Jul 6, 2020	Multi-Goal Reinforcement Learningreinforcement-learning	CodeCode Available	1
Meta-Learning through Hebbian Plasticity in Random Networks	Jul 6, 2020	Lifelong learningNavigate	CodeCode Available	1
Mission schedule of agile satellites based on Proximal Policy Optimization Algorithm	Jul 5, 2020	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 410 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified