Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11851–11900 of 15113 papers

Title	Date	Tasks	Status
On the convergence of projective-simulation-based reinforcement learning in Markov decision processes	Oct 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Relay Policy Learning: Solving Long-Horizon Tasks via Imitation and Reinforcement Learning	Oct 25, 2019	Imitation Learningreinforcement-learning	CodeCode Available
MAMPS: Safe Multi-Agent Reinforcement Learning via Model Predictive Shielding	Oct 25, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Synthesizing Functions in Higher-Order Logic	Oct 25, 2019	Automated Theorem ProvingBIG-bench Machine Learning	CodeCode Available
HRL4IN: Hierarchical Reinforcement Learning for Interactive Navigation with Mobile Manipulators	Oct 24, 2019	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available
Case Study: Verifying the Safety of an Autonomous Racing Car with a Neural Network Controller	Oct 24, 2019	Autonomous Racingreinforcement-learning	—Unverified
Collision Avoidance in Pedestrian-Rich Environments with Deep Reinforcement Learning	Oct 24, 2019	Collision AvoidanceDecision Making	CodeCode Available
Pre-training in Deep Reinforcement Learning for Automatic Speech Recognition	Oct 24, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Rationally Inattentive Inverse Reinforcement Learning Explains YouTube Commenting Behavior	Oct 24, 2019	Clusteringreinforcement-learning	CodeCode Available
Robust Model Predictive Shielding for Safe Reinforcement Learning with Stochastic Dynamics	Oct 24, 2019	Learning Theoryreinforcement-learning	—Unverified
Robust Visual Domain Randomization for Reinforcement Learning	Oct 23, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Partially Detected Intelligent Traffic Signal Control: Environmental Adaptation	Oct 23, 2019	Q-LearningReinforcement Learning	—Unverified
Sample Complexity of Reinforcement Learning using Linearly Combined Model Ensembles	Oct 23, 2019	Model Selectionreinforcement-learning	—Unverified
Attention-based Curiosity-driven Exploration in Deep Reinforcement Learning	Oct 23, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Contextual Imagined Goals for Self-Supervised Robotic Learning	Oct 23, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Optimizing Percentile Criterion Using Robust MDPs	Oct 23, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Efficient Decoupled Neural Architecture Search by Structure and Operation Sampling	Oct 23, 2019	Neural Architecture Searchreinforcement-learning	CodeCode Available
Faster and Safer Training by Embedding High-Level Knowledge into Deep Reinforcement Learning	Oct 22, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
State2vec: Off-Policy Successor Features Approximators	Oct 22, 2019	Meta Reinforcement Learningreinforcement-learning	—Unverified
Teach Biped Robots to Walk via Gait Principles and Reinforcement Learning with Adversarial Critics	Oct 22, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Self-Supervised Sim-to-Real Adaptation for Visual Robotic Manipulation	Oct 21, 2019	Deep Reinforcement LearningDomain Adaptation	—Unverified
Resource Allocation in Mobility-Aware Federated Learning Networks: A Deep Reinforcement Learning Approach	Oct 21, 2019	Deep Reinforcement LearningFederated Learning	—Unverified
Multi-agent Hierarchical Reinforcement Learning with Dynamic Termination	Oct 21, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Momentum in Reinforcement Learning	Oct 21, 2019	Atari Gamesreinforcement-learning	—Unverified
Towards a Reinforcement Learning Environment Toolbox for Intelligent Electric Motor Control	Oct 21, 2019	Model Predictive ControlOpenAI Gym	CodeCode Available
Modelling Generalized Forces with Reinforcement Learning for Sim-to-Real Transfer	Oct 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
Policy Optimization for H_2 Linear Control with H_ Robustness Guarantee: Implicit Regularization and Global Convergence	Oct 21, 2019	Policy Gradient MethodsReinforcement Learning	—Unverified
Regularization Matters in Policy Optimization	Oct 21, 2019	continuous-controlContinuous Control	CodeCode Available
Application of Reinforcement Learning for 5G Scheduling Parameter Optimization	Oct 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
Adversarial Skill Networks: Unsupervised Robot Skill Learning from Video	Oct 21, 2019	continuous-controlContinuous Control	CodeCode Available
IPO: Interior-point Policy Optimization under Constraints	Oct 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
Good, Better, Best: Textual Distractors Generation for Multiple-Choice Visual Question Answering via Reinforcement Learning	Oct 21, 2019	Data AugmentationDecision Making	—Unverified
Dealing with Sparse Rewards in Reinforcement Learning	Oct 21, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Combining Benefits from Trajectory Optimization and Deep Reinforcement Learning	Oct 21, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Human-Like Decision Making: Document-level Aspect Sentiment Classification via Hierarchical Reinforcement Learning	Oct 21, 2019	Decision MakingGeneral Classification	—Unverified
Autonomous Industrial Management via Reinforcement Learning: Self-Learning Agents for Decision-Making -- A Review	Oct 20, 2019	Decision MakingFault Detection	—Unverified
Policy Learning for Malaria Control	Oct 20, 2019	Bayesian OptimizationDecision Making	CodeCode Available
RLScheduler: An Automated HPC Batch Job Scheduler Using Reinforcement Learning	Oct 20, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Towards More Sample Efficiency in Reinforcement Learning with Data Augmentation	Oct 19, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available
Opinion shaping in social networks using reinforcement learning	Oct 19, 2019	reinforcement-learningReinforcement Learning	—Unverified
Natural Question Generation with Reinforcement Learning Based Graph-to-Sequence Model	Oct 19, 2019	Graph Neural NetworkGraph-to-Sequence	CodeCode Available
Explainable AI: Deep Reinforcement Learning Agents for Residential Demand Side Cost Savings in Smart Grids	Oct 19, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Active 6D Multi-Object Pose Estimation in Cluttered Scenarios with Deep Reinforcement Learning	Oct 19, 2019	Deep Reinforcement LearningObject	—Unverified
A Structured Prediction Approach for Generalization in Cooperative Multi-Agent Reinforcement Learning	Oct 19, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Graph Convolutional Policy for Solving Tree Decomposition via Reinforcement Learning Heuristics	Oct 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
OffWorld Gym: open-access physical robotics environment for real-world reinforcement learning benchmark and research	Oct 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
On Connections between Constrained Optimization and Reinforcement Learning	Oct 18, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Multi-View Reinforcement Learning	Oct 18, 2019	Decision Makingreinforcement-learning	CodeCode Available
On the Sample Complexity of Actor-Critic Method for Reinforcement Learning with Function Approximation	Oct 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
Unsupervised Context Rewriting for Open Domain Conversation	Oct 18, 2019	DecoderReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 238 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified