Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12301–12350 of 15113 papers

Title	Date	Tasks	Status	Hype
Proximal Distilled Evolutionary Reinforcement Learning	Jun 24, 2019	OpenAI Gymreinforcement-learning	CodeCode Available	0
Optimal Use of Experience in First Person Shooter Environments	Jun 24, 2019	Q-LearningReinforcement Learning	—Unverified	0
Modern Deep Reinforcement Learning Algorithms	Jun 24, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Ranking Policy Gradient	Jun 24, 2019	Policy Gradient MethodsReinforcement Learning	CodeCode Available	0
Neural networks with motivation	Jun 23, 2019	Hierarchical Reinforcement LearningNavigate	—Unverified	0
Reinforcement Learning-Based Trajectory Design for the Aerial Base Stations	Jun 23, 2019	Q-Learningreinforcement-learning	—Unverified	0
A neurally plausible model learns successor representations in partially observable environments	Jun 22, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
A Story of Two Streams: Reinforcement Learning Models from Human Behavior and Neuropsychiatry	Jun 21, 2019	Decision MakingLifelong learning	CodeCode Available	1
Split Q Learning: Reinforcement Learning with Two-Stream Rewards	Jun 21, 2019	Decision MakingQ-Learning	CodeCode Available	1
Revised Progressive-Hedging-Algorithm Based Two-layer Solution Scheme for Bayesian Reinforcement Learning	Jun 21, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning with Convex Constraints	Jun 21, 2019	Diversityreinforcement-learning	CodeCode Available	1
Shaping Belief States with Generative Environment Models for RL	Jun 21, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
A Study of State Aliasing in Structured Prediction with RNNs	Jun 21, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Disentangled Skill Embeddings for Reinforcement Learning	Jun 21, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Leveraging Reinforcement Learning Techniques for Effective Policy Adoption and Validation	Jun 21, 2019	Decision Makingreinforcement-learning	—Unverified	0
Continual Reinforcement Learning with Diversity Exploration and Adversarial Self-Correction	Jun 21, 2019	Autonomous Drivingcontinuous-control	—Unverified	0
Cache-Aided NOMA Mobile Edge Computing: A Reinforcement Learning Approach	Jun 20, 2019	Edge-computingQ-Learning	—Unverified	0
A Hierarchical Architecture for Sequential Decision-Making in Autonomous Driving using Deep Reinforcement Learning	Jun 20, 2019	Autonomous DrivingDecision Making	CodeCode Available	0
Finding Needles in a Moving Haystack: Prioritizing Alerts with Adversarial Reinforcement Learning	Jun 20, 2019	Intrusion Detectionreinforcement-learning	—Unverified	0
Cooperative Lane Changing via Deep Reinforcement Learning	Jun 20, 2019	Autonomous VehiclesDeep Reinforcement Learning	—Unverified	0
A Deep Reinforcement Learning Approach for Global Routing	Jun 20, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Placeto: Learning Generalizable Device Placement Algorithms for Distributed Machine Learning	Jun 20, 2019	BIG-bench Machine LearningReinforcement Learning	CodeCode Available	0
When Multiple Agents Learn to Schedule: A Distributed Radio Resource Management Framework	Jun 20, 2019	Deep Reinforcement LearningManagement	—Unverified	0
Variable Impedance Control in End-Effector Space: An Action Space for Reinforcement Learning in Contact-Rich Tasks	Jun 20, 2019	Contact-rich ManipulationReinforcement Learning	—Unverified	0
Unsupervised Learning of Object Keypoints for Perception and Control	Jun 19, 2019	3D Action Recognitionimage-classification	CodeCode Available	1
Experience Replay Optimization	Jun 19, 2019	continuous-controlContinuous Control	—Unverified	0
Calibrated Model-Based Deep Reinforcement Learning	Jun 19, 2019	Deep Reinforcement Learningmodel	CodeCode Available	0
Adapting Behaviour via Intrinsic Reward: A Survey and Empirical Study	Jun 19, 2019	Active Learningreinforcement-learning	—Unverified	0
Wasserstein Adversarial Imitation Learning	Jun 19, 2019	Imitation Learningreinforcement-learning	—Unverified	0
When to Trust Your Model: Model-Based Policy Optimization	Jun 19, 2019	modelModel-based Reinforcement Learning	CodeCode Available	1
Reward Prediction Error as an Exploration Objective in Deep RL	Jun 19, 2019	Atari GamesContinuous Control	—Unverified	0
Multi-user Resource Control with Deep Reinforcement Learning in IoT Edge Computing	Jun 19, 2019	Deep Reinforcement LearningEdge-computing	—Unverified	0
Directed Exploration for Reinforcement Learning	Jun 18, 2019	Efficient Explorationreinforcement-learning	—Unverified	0
Hill Climbing on Value Estimates for Search-control in Dyna	Jun 18, 2019	Model-based Reinforcement LearningReinforcement Learning	—Unverified	0
Language as an Abstraction for Hierarchical Deep Reinforcement Learning	Jun 18, 2019	Deep Reinforcement LearningInstruction Following	CodeCode Available	0
Gap-Increasing Policy Evaluation for Efficient and Noise-Tolerant Reinforcement Learning	Jun 18, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Evolutionary Reinforcement Learning for Sample-Efficient Multiagent Coordination	Jun 18, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Robust Reinforcement Learning for Continuous Control with Model Misspecification	Jun 18, 2019	continuous-controlContinuous Control	—Unverified	0
Towards White-box Benchmarks for Algorithm Control	Jun 18, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Sample-efficient Adversarial Imitation Learning from Observation	Jun 18, 2019	Imitation LearningReinforcement Learning	—Unverified	0
RIDM: Reinforced Inverse Dynamics Modeling for Learning from a Single Observed Demonstration	Jun 18, 2019	Imitation Learningreinforcement-learning	—Unverified	0
Universal Successor Features Based Deep Reinforcement Learning for Navigation	Jun 17, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Joint Planning and Learning Framework for Human-Aided Decision-Making	Jun 17, 2019	Decision MakingGeneral Knowledge	—Unverified	0
LPaintB: Learning to Paint from Self-Supervision	Jun 17, 2019	GPUreinforcement-learning	—Unverified	0
Iterative Model-Based Reinforcement Learning Using Simulations in the Differentiable Neural Computer	Jun 17, 2019	Lifelong learningModel-based Reinforcement Learning	—Unverified	0
Learning-Driven Exploration for Reinforcement Learning	Jun 17, 2019	Efficient ExplorationFPS Games	CodeCode Available	0
A gray-box approach for curriculum learning	Jun 17, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
MoËT: Mixture of Expert Trees and its Application to Verifiable Reinforcement Learning	Jun 16, 2019	Game of GoImitation Learning	CodeCode Available	1
Reinforcement Learning Driven Heuristic Optimization	Jun 16, 2019	Combinatorial Optimizationreinforcement-learning	—Unverified	0
Reinforcement Learning with Non-uniform State Representations for Adaptive Search	Jun 15, 2019	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 247 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified