Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12251–12300 of 15113 papers

Title	Date	Tasks	Status	Hype
Voting-Based Multi-Agent Reinforcement Learning for Intelligent IoT	Jul 2, 2019	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
Modified Actor-Critics	Jul 2, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Generalizing from a few environments in safety-critical reinforcement learning	Jul 2, 2019	BlockingDeep Reinforcement Learning	—Unverified	0
A Reinforcement Learning Approach for the Multichannel Rendezvous Problem	Jul 2, 2019	channel selectionreinforcement-learning	—Unverified	0
Dynamic Face Video Segmentation via Reinforcement Learning	Jul 2, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Conservative Q-Improvement: Reinforcement Learning for an Interpretable Decision-Tree Policy	Jul 2, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Learning How to Active Learn by Dreaming	Jul 1, 2019	Active Learningnamed-entity-recognition	CodeCode Available	0
Look Harder: A Neural Machine Translation Model with Hard Attention	Jul 1, 2019	Hard AttentionMachine Translation	—Unverified	0
Using Semantic Similarity as Reward for Reinforcement Learning in Sentence Generation	Jul 1, 2019	NMTreinforcement-learning	—Unverified	0
Reinforced Training Data Selection for Domain Adaptation	Jul 1, 2019	Dependency ParsingDomain Adaptation	—Unverified	0
Historical Text Normalization with Delayed Rewards	Jul 1, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
End-to-end Deep Reinforcement Learning Based Coreference Resolution	Jul 1, 2019	coreference-resolutionCoreference Resolution	—Unverified	0
Designing Deep Reinforcement Learning for Human Parameter Exploration	Jul 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning World Graphs to Accelerate Hierarchical Reinforcement Learning	Jul 1, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
FiDi-RL: Incorporating Deep Reinforcement Learning with Finite-Difference Policy Search for Efficient Learning of Continuous Control	Jul 1, 2019	continuous-controlContinuous Control	—Unverified	0
Stochastic Latent Actor-Critic: Deep Reinforcement Learning with a Latent Variable Model	Jul 1, 2019	continuous-controlContinuous Control	CodeCode Available	0
On mechanisms for transfer using landmark value functions in multi-task lifelong reinforcement learning	Jul 1, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Variational Quantum Circuits for Deep Reinforcement Learning	Jun 30, 2019	BIG-bench Machine LearningDecision Making	CodeCode Available	0
Multiple Landmark Detection using Multi-Agent Reinforcement Learning	Jun 30, 2019	AnatomyMedical Image Analysis	CodeCode Available	0
Way Off-Policy Batch Deep Reinforcement Learning of Implicit Human Preferences in Dialog	Jun 30, 2019	Deep Reinforcement LearningOpen-Domain Dialog	—Unverified	0
Collaboration of AI Agents via Cooperative Multi-Agent Deep Reinforcement Learning	Jun 30, 2019	counterfactualDeep Reinforcement Learning	—Unverified	0
Detecting Spiky Corruption in Markov Decision Processes	Jun 30, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
On Training Flexible Robots using Deep Reinforcement Learning	Jun 29, 2019	Deep Reinforcement LearningIndustrial Robots	—Unverified	0
Growing Action Spaces	Jun 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Learning-based Model Predictive Control for Safe Exploration and Reinforcement Learning	Jun 27, 2019	Model Predictive Controlreinforcement-learning	CodeCode Available	0
Hyp-RL : Hyperparameter Optimization by Reinforcement Learning	Jun 27, 2019	Bayesian OptimizationHyperparameter Optimization	CodeCode Available	0
From self-tuning regulators to reinforcement learning and back again	Jun 27, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Adaptive Honeypot Engagement through Reinforcement Learning of Semi-Markov Decision Processes	Jun 27, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Demonstration-Guided Deep Reinforcement Learning of Control Policies for Dexterous Human-Robot Interaction	Jun 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
QFlip: An Adaptive Reinforcement Learning Strategy for the FlipIt Security Game	Jun 27, 2019	OpenAI GymQ-Learning	CodeCode Available	0
Toward Simulating Environments in Reinforcement Learning Based Recommendations	Jun 27, 2019	Generative Adversarial NetworkRecommendation Systems	—Unverified	0
Compositional Transfer in Hierarchical Reinforcement Learning	Jun 26, 2019	General Reinforcement LearningHierarchical Reinforcement Learning	—Unverified	0
PyRep: Bringing V-REP to Deep Robot Learning	Jun 26, 2019	Imitation Learningreinforcement-learning	CodeCode Available	0
Towards Empathic Deep Q-Learning	Jun 26, 2019	EthicsQ-Learning	CodeCode Available	0
Approximate Dynamic Programming For Linear Systems with State and Input Constraints	Jun 26, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Cooperation-Aware Reinforcement Learning for Merging in Dense Traffic	Jun 26, 2019	Autonomous VehiclesDecision Making	CodeCode Available	0
A Tractable Algorithm For Finite-Horizon Continuous Reinforcement Learning	Jun 26, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Efficient Navigation of Colloidal Robots in an Unknown Environment via Deep Reinforcement Learning	Jun 26, 2019	Deep Reinforcement LearningNavigate	—Unverified	0
Probabilistic model predictive safety certification for learning-based control	Jun 25, 2019	Autonomous DrivingBayesian Inference	—Unverified	0
Policy Optimization with Stochastic Mirror Descent	Jun 25, 2019	Continuous ControlPolicy Gradient Methods	—Unverified	0
Reinforcement Learning with Competitive Ensembles of Information-Constrained Primitives	Jun 25, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
On Multi-Agent Learning in Team Sports Games	Jun 25, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Optimistic Proximal Policy Optimization	Jun 25, 2019	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Neural Proximal/Trust Region Policy Optimization Attains Globally Optimal Policy	Jun 25, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Multi-Agent Deep Reinforcement Learning for Liquidation Strategy Analysis	Jun 24, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Event-Driven Models	Jun 24, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
A Theoretical Connection Between Statistical Physics and Reinforcement Learning	Jun 24, 2019	Decision Makingreinforcement-learning	—Unverified	0
Deceptive Reinforcement Learning Under Adversarial Manipulations on Cost Signals	Jun 24, 2019	Q-Learningreinforcement-learning	—Unverified	0
Deep Conservative Policy Iteration	Jun 24, 2019	Atari GamesDeep Reinforcement Learning	—Unverified	0
Inverse reinforcement learning conditioned on brain scan	Jun 24, 2019	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 246 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified