Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10551–10600 of 15113 papers

Title	Date	Tasks	Status	Hype
Model-Based Reinforcement Learning with Value-Targeted Regression	Jun 1, 2020	modelModel-based Reinforcement Learning	—Unverified	0
Robust Reinforcement Learning with Wasserstein Constraint	Jun 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement learning and Bayesian data assimilation for model-informed precision dosing in oncology	Jun 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Temporal-Differential Learning in Continuous Environments	Jun 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
PlanGAN: Model-based Planning With Sparse Rewards and Multiple Goals	Jun 1, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
A novel approach for multi-agent cooperative pursuit to capture grouped evaders	Jun 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Invariant Policy Optimization: Towards Stronger Generalization in Reinforcement Learning	Jun 1, 2020	Policy Gradient Methodsreinforcement-learning	CodeCode Available	1
Encoding formulas as deep networks: Reinforcement learning for zero-shot execution of LTL formulas	Jun 1, 2020	MinecraftMulti-Task Learning	CodeCode Available	1
Acme: A Research Framework for Distributed Reinforcement Learning	Jun 1, 2020	Deep Reinforcement LearningDQN Replay Dataset	CodeCode Available	1
Variational Reward Estimator Bottleneck: Learning Robust Reward Estimator for Multi-Domain Task-Oriented Dialog	May 31, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
MM-KTD: Multiple Model Kalman Temporal Differences for Reinforcement Learning	May 30, 2020	Active Learningreinforcement-learning	CodeCode Available	0
Reinforcement Learning	May 29, 2020	Autonomous VehiclesBoard Games	CodeCode Available	0
Sim2Real for Peg-Hole Insertion with Eye-in-Hand Camera	May 29, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
AI-based Resource Allocation: Reinforcement Learning for Adaptive Auto-scaling in Serverless Environments	May 29, 2020	Cloud ComputingManagement	—Unverified	0
Deep Reinforcement learning for real autonomous mobile robot navigation in indoor environments	May 28, 2020	continuous-controlContinuous Control	CodeCode Available	1
Intelligent Residential Energy Management System using Deep Reinforcement Learning	May 28, 2020	Deep Reinforcement Learningenergy management	—Unverified	0
Domain Knowledge Integration By Gradient Matching For Sample-Efficient Reinforcement Learning	May 28, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Predicting Goal-directed Human Attention Using Inverse Reinforcement Learning	May 28, 2020	Objectreinforcement-learning	CodeCode Available	1
Revisiting Parameter Sharing in Multi-Agent Deep Reinforcement Learning	May 27, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	0
MOPO: Model-based Offline Policy Optimization	May 27, 2020	continuous-controlContinuous Control	CodeCode Available	1
Anomaly Detection Under Controlled Sensing Using Actor-Critic Reinforcement Learning	May 26, 2020	Anomaly DetectionDecision Making	—Unverified	0
ALBA : Reinforcement Learning for Video Object Segmentation	May 26, 2020	ObjectOne-shot visual object segmentation	CodeCode Available	0
Towards intervention-centric causal reasoning in learning agents	May 26, 2020	Deep Reinforcement LearningMeta-Learning	—Unverified	0
Modeling Penetration Testing with Reinforcement Learning Using Capture-the-Flag Challenges: Trade-offs between Model-free Learning and A Priori Knowledge	May 26, 2020	Q-Learningreinforcement-learning	CodeCode Available	1
Time-Variant Variational Transfer for Value Functions	May 26, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Efficient Use of heuristics for accelerating XCS-based Policy Learning in Markov Games	May 26, 2020	Reinforcement Learning (RL)	—Unverified	0
A reinforcement learning approach to rare trajectory sampling	May 26, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Active Measure Reinforcement Learning for Observation Cost Minimization	May 26, 2020	Decision MakingQ-Learning	—Unverified	0
Integrating LEO Satellite and UAV Relaying via Reinforcement Learning for Non-Terrestrial Networks	May 26, 2020	Deep Reinforcement LearningDimensionality Reduction	—Unverified	0
Breaking the Sample Size Barrier in Model-Based Reinforcement Learning with a Generative Model	May 26, 2020	modelModel-based Reinforcement Learning	—Unverified	0
Deep Reinforcement Learning Based Power Allocation for D2D Network	May 25, 2020	Deep Reinforcement LearningQ-Learning	—Unverified	0
Implementation Matters in Deep Policy Gradients: A Case Study on PPO and TRPO	May 25, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Meta-Reinforcement Learning for Trajectory Design in Wireless UAV Networks	May 25, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Optimization-driven Deep Reinforcement Learning for Robust Beamforming in IRS-assisted Wireless Communications	May 25, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning with Iterative Reasoning for Merging in Dense Traffic	May 25, 2020	Autonomous Vehiclesreinforcement-learning	—Unverified	0
Policy Entropy for Out-of-Distribution Classification	May 25, 2020	BenchmarkingClassification	—Unverified	0
Gradient Monitored Reinforcement Learning	May 25, 2020	Atari Gamescontinuous-control	—Unverified	0
Deep Learning Models for Automatic Summarization	May 25, 2020	Deep Learningreinforcement-learning	—Unverified	0
Dynamic Value Estimation for Single-Task Multi-Scene Reinforcement Learning	May 25, 2020	ClusteringDeep Reinforcement Learning	—Unverified	0
Generator and Critic: A Deep Reinforcement Learning Approach for Slate Re-ranking in E-commerce	May 25, 2020	Deep Reinforcement LearningDiversity	—Unverified	0
GoChat: Goal-oriented Chatbots with Hierarchical Reinforcement Learning	May 24, 2020	ChatbotHierarchical Reinforcement Learning	—Unverified	0
Automatic Discovery of Interpretable Planning Strategies	May 24, 2020	ClusteringDecision Making	CodeCode Available	0
Model-free Reinforcement Learning for Stochastic Stackelberg Security Games	May 24, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Adaptive Reinforcement Learning through Evolving Self-Modifying Neural Networks	May 22, 2020	Meta-Learningreinforcement-learning	—Unverified	0
Towards Automated Safety Coverage and Testing for Autonomous Vehicles with Reinforcement Learning	May 22, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Reinforcement learning with human advice: a survey	May 22, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Evaluating Generalisation in General Video Game Playing	May 22, 2020	Reinforcement Learning (RL)	—Unverified	0
Q-NAV: NAV Setting Method based on Reinforcement Learning in Underwater Wireless Networks	May 21, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning with General Value Function Approximation: Provably Efficient Approach via Bounded Eluder Dimension	May 21, 2020	Reinforcement Learning (RL)	—Unverified	0
Novel Policy Seeking with Constrained Optimization	May 21, 2020	DiversityMuJoCo	CodeCode Available	0

Show:10 25 50

← PrevPage 212 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified