Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10451–10475 of 15113 papers

Title	Date	Tasks	Status	Hype
SAMBA: Safe Model-Based & Active Reinforcement Learning	Jun 12, 2020	modelReinforcement Learning	CodeCode Available	1
Safety-guaranteed Reinforcement Learning based on Multi-class Support Vector Machine	Jun 12, 2020	Q-Learningreinforcement-learning	—Unverified	0
Continuous Control for Searching and Planning with a Learned Model	Jun 12, 2020	continuous-controlContinuous Control	—Unverified	0
Deep Reinforcement Learning for Neural Control	Jun 12, 2020	Deep Reinforcement LearningQ-Learning	—Unverified	0
A Brief Look at Generalization in Visual Meta-Reinforcement Learning	Jun 12, 2020	Deep Reinforcement LearningMeta Reinforcement Learning	—Unverified	0
Human and Multi-Agent collaboration in a human-MARL teaming framework	Jun 12, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
Decorrelated Double Q-learning	Jun 12, 2020	continuous-controlContinuous Control	—Unverified	0
Shared Experience Actor-Critic for Multi-Agent Reinforcement Learning	Jun 12, 2020	Efficient ExplorationMulti-agent Reinforcement Learning	CodeCode Available	1
Potential Field Guided Actor-Critic Reinforcement Learning	Jun 12, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Mutual Information Based Knowledge Transfer Under State-Action Dimension Mismatch	Jun 12, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
TorsionNet: A Reinforcement Learning Approach to Sequential Conformer Search	Jun 12, 2020	Computational chemistryreinforcement-learning	CodeCode Available	1
Meta-Reinforcement Learning Robust to Distributional Shift via Model Identification and Experience Relabeling	Jun 12, 2020	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Recurrent Sum-Product-Max Networks for Decision Making in Perfectly-Observed Environments	Jun 12, 2020	Decision Makingreinforcement-learning	CodeCode Available	0
Using Reinforcement Learning to Allocate and Manage Service Function Chains in Cellular Networks	Jun 12, 2020	Managementreinforcement-learning	—Unverified	0
Modelling Hierarchical Structure between Dialogue Policy and Natural Language Generator with Option Framework for Task-oriented Dialogue System	Jun 11, 2020	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	1
Surveys without Questions: A Reinforcement Learning Approach	Jun 11, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Sample Efficient Reinforcement Learning via Low-Rank Matrix Estimation	Jun 11, 2020	Learning Theoryreinforcement-learning	—Unverified	0
Multi-Agent Informational Learning Processes	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Exploration by Maximizing Rényi Entropy for Reward-Free RL Framework	Jun 11, 2020	Q-LearningReinforcement Learning (RL)	—Unverified	0
Deep Reinforcement Learning for Electric Transmission Voltage Control	Jun 11, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Closed Loop Neural-Symbolic Learning via Integrating Neural Perception, Grammar Parsing, and Symbolic Reasoning	Jun 11, 2020	Question AnsweringReinforcement Learning (RL)	CodeCode Available	1
Multi-Agent Reinforcement Learning in Stochastic Networked Systems	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Scalable Multi-Agent Reinforcement Learning for Networked Systems with Average Reward	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Zeroth-Order Supervised Policy Improvement	Jun 11, 2020	continuous-controlContinuous Control	—Unverified	0
Multi-Agent Reinforcement Learning in a Realistic Limit Order Book Market Simulation	Jun 10, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0

Show:10 25 50

← PrevPage 419 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified