Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11651–11700 of 15113 papers

Title	Date	Tasks	Status	Hype
Learning to Predict Without Looking Ahead: World Models Without Forward Prediction	Oct 29, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	2
Constrained Reinforcement Learning Has Zero Duality Gap	Oct 29, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Biomimetic Ultra-Broadband Perfect Absorbers Optimised with Reinforcement Learning	Oct 28, 2019	Q-Learningreinforcement-learning	—Unverified	0
Certified Adversarial Robustness for Deep Reinforcement Learning	Oct 28, 2019	Adversarial RobustnessCollision Avoidance	—Unverified	0
Asynchronous Methods for Model-Based Reinforcement Learning	Oct 28, 2019	modelModel-based Reinforcement Learning	CodeCode Available	0
Entity Abstraction in Visual Model-Based Reinforcement Learning	Oct 28, 2019	modelModel-based Reinforcement Learning	CodeCode Available	0
Quantum enhancements for deep reinforcement learning in large spaces	Oct 28, 2019	BIG-bench Machine LearningDecision Making	CodeCode Available	0
Learning Data Manipulation for Augmentation and Weighting	Oct 28, 2019	Data AugmentationReinforcement Learning	CodeCode Available	1
Generalization in Reinforcement Learning with Selective Noise Injection and Information Bottleneck	Oct 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Neural Architecture Evolution in Deep Reinforcement Learning for Continuous Control	Oct 28, 2019	continuous-controlContinuous Control	—Unverified	0
Model-Free Mean-Field Reinforcement Learning: Mean-Field MDP and Mean-Field Q-Learning	Oct 28, 2019	General Reinforcement LearningQ-Learning	—Unverified	0
Minimax Weight and Q-Function Learning for Off-Policy Evaluation	Oct 28, 2019	Off-policy evaluationReinforcement Learning	—Unverified	0
Task-Oriented Language Grounding for Language Input with Multiple Sub-Goals of Non-Linear Order	Oct 27, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
BAIL: Best-Action Imitation Learning for Batch Deep Reinforcement Learning	Oct 27, 2019	Deep Reinforcement LearningImitation Learning	CodeCode Available	0
Reinforcement Learning-Enabled Reliable Wireless Sensor Networks in Dynamic Underground Environments	Oct 26, 2019	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
ZPD Teaching Strategies for Deep Reinforcement Learning from Demonstrations	Oct 26, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Convergent Policy Optimization for Safe Reinforcement Learning	Oct 26, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Comparing Observation and Action Representations for Deep Reinforcement Learning in μRTS	Oct 26, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
MAMPS: Safe Multi-Agent Reinforcement Learning via Model Predictive Shielding	Oct 25, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
On the convergence of projective-simulation-based reinforcement learning in Markov decision processes	Oct 25, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Relay Policy Learning: Solving Long-Horizon Tasks via Imitation and Reinforcement Learning	Oct 25, 2019	Imitation Learningreinforcement-learning	CodeCode Available	0
Deep Reinforcement Learning for Synthesizing Functions in Higher-Order Logic	Oct 25, 2019	Automated Theorem ProvingBIG-bench Machine Learning	CodeCode Available	0
Case Study: Verifying the Safety of an Autonomous Racing Car with a Neural Network Controller	Oct 24, 2019	Autonomous Racingreinforcement-learning	—Unverified	0
HRL4IN: Hierarchical Reinforcement Learning for Interactive Navigation with Mobile Manipulators	Oct 24, 2019	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	0
Collision Avoidance in Pedestrian-Rich Environments with Deep Reinforcement Learning	Oct 24, 2019	Collision AvoidanceDecision Making	CodeCode Available	0
Rationally Inattentive Inverse Reinforcement Learning Explains YouTube Commenting Behavior	Oct 24, 2019	Clusteringreinforcement-learning	CodeCode Available	0
Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning	Oct 24, 2019	Meta-LearningMeta Reinforcement Learning	CodeCode Available	2
Robust Model Predictive Shielding for Safe Reinforcement Learning with Stochastic Dynamics	Oct 24, 2019	Learning Theoryreinforcement-learning	—Unverified	0
Pre-training in Deep Reinforcement Learning for Automatic Speech Recognition	Oct 24, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Contextual Imagined Goals for Self-Supervised Robotic Learning	Oct 23, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Attention-based Curiosity-driven Exploration in Deep Reinforcement Learning	Oct 23, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Efficient Decoupled Neural Architecture Search by Structure and Operation Sampling	Oct 23, 2019	Neural Architecture Searchreinforcement-learning	CodeCode Available	0
Optimizing Percentile Criterion Using Robust MDPs	Oct 23, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Learning Q-network for Active Information Acquisition	Oct 23, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Sample Complexity of Reinforcement Learning using Linearly Combined Model Ensembles	Oct 23, 2019	Model Selectionreinforcement-learning	—Unverified	0
Partially Detected Intelligent Traffic Signal Control: Environmental Adaptation	Oct 23, 2019	Q-LearningReinforcement Learning	—Unverified	0
Robust Visual Domain Randomization for Reinforcement Learning	Oct 23, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Teach Biped Robots to Walk via Gait Principles and Reinforcement Learning with Adversarial Critics	Oct 22, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
State2vec: Off-Policy Successor Features Approximators	Oct 22, 2019	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Faster and Safer Training by Embedding High-Level Knowledge into Deep Reinforcement Learning	Oct 22, 2019	Decision MakingDeep Reinforcement Learning	—Unverified	0
Application of Reinforcement Learning for 5G Scheduling Parameter Optimization	Oct 21, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
IPO: Interior-point Policy Optimization under Constraints	Oct 21, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Combining Benefits from Trajectory Optimization and Deep Reinforcement Learning	Oct 21, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning to Map Natural Language Instructions to Physical Quadcopter Control using Simulated Flight	Oct 21, 2019	continuous-controlContinuous Control	CodeCode Available	1
Resource Allocation in Mobility-Aware Federated Learning Networks: A Deep Reinforcement Learning Approach	Oct 21, 2019	Deep Reinforcement LearningFederated Learning	—Unverified	0
Self-Supervised Sim-to-Real Adaptation for Visual Robotic Manipulation	Oct 21, 2019	Deep Reinforcement LearningDomain Adaptation	—Unverified	0
Multi-agent Hierarchical Reinforcement Learning with Dynamic Termination	Oct 21, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Policy Optimization for H_2 Linear Control with H_ Robustness Guarantee: Implicit Regularization and Global Convergence	Oct 21, 2019	Policy Gradient MethodsReinforcement Learning	—Unverified	0
Regularization Matters in Policy Optimization	Oct 21, 2019	continuous-controlContinuous Control	CodeCode Available	0
Modelling Generalized Forces with Reinforcement Learning for Sim-to-Real Transfer	Oct 21, 2019	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 234 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified