Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12901–12950 of 15113 papers

Title	Date	Tasks	Status	Hype
The StarCraft Multi-Agent Challenge	Feb 11, 2019	BenchmarkingMuJoCo	CodeCode Available	1
Whole-Chain Recommendations	Feb 11, 2019	Multi-agent Reinforcement LearningRecommendation Systems	—Unverified	0
A Bandit Framework for Optimal Selection of Reinforcement Learning Agents	Feb 10, 2019	Deep Reinforcement LearningInductive Bias	—Unverified	0
Reinforcement Learning from Hierarchical Critics	Feb 8, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Distributional reinforcement learning with linear function approximation	Feb 8, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Rethinking the Discount Factor in Reinforcement Learning: A Decision Theoretic Approach	Feb 8, 2019	Decision Makingreinforcement-learning	—Unverified	0
Novelty Search for Deep Reinforcement Learning Policy Network Weights by Action Sequence Edit Metric Distance	Feb 8, 2019	Deep Reinforcement LearningEvolutionary Algorithms	CodeCode Available	0
Metaoptimization on a Distributed System for Deep Reinforcement Learning	Feb 7, 2019	Atari GamesDeep Reinforcement Learning	—Unverified	0
Visual search and recognition for robot task execution and monitoring	Feb 7, 2019	Common Sense ReasoningDeep Reinforcement Learning	—Unverified	0
Bayesian Reinforcement Learning via Deep, Sparse Sampling	Feb 7, 2019	Efficient Explorationreinforcement-learning	CodeCode Available	0
Artificial Intelligence for Prosthetics - challenge solutions	Feb 7, 2019	Deep Reinforcement LearningImitation Learning	CodeCode Available	0
Neural Fictitious Self-Play on ELF Mini-RTS	Feb 6, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
On L_2-consistency of nearest neighbor matching	Feb 6, 2019	Causal InferenceDomain Adaptation	—Unverified	0
Space Navigator: a Tool for the Optimization of Collision Avoidance Maneuvers	Feb 6, 2019	Collision Avoidancereinforcement-learning	—Unverified	0
Decentralized Multi-Agents by Imitation of a Centralized Controller	Feb 6, 2019	Imitation LearningMulti-agent Reinforcement Learning	—Unverified	0
A Guiding Principle for Causal Decision Problems	Feb 6, 2019	Decision Makingreinforcement-learning	—Unverified	0
Adaptive Stress Testing for Autonomous Vehicles	Feb 5, 2019	Autonomous VehiclesDecision Making	—Unverified	0
Separating value functions across time-scales	Feb 5, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Reinforcement Learning for Optimal Load Distribution Sequencing in Resource-Sharing System	Feb 5, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Polyphonic Music Composition with LSTM Neural Networks and Reinforcement Learning	Feb 5, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Learning to Schedule Communication in Multi-agent Reinforcement Learning	Feb 5, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	0
AlphaStar: An Evolutionary Computation Perspective	Feb 5, 2019	DiversityReinforcement Learning	—Unverified	0
Interactively shaping robot behaviour with unlabeled human instructions	Feb 5, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Total stochastic gradient algorithms and applications in reinforcement learning	Feb 5, 2019	Density Estimationreinforcement-learning	—Unverified	0
The Natural Language of Actions	Feb 4, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
PIPPS: Flexible Model-Based Policy Search Robust to the Curse of Chaos	Feb 4, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	0
Value-aware Recommendation based on Reinforced Profit Maximization in E-commerce Systems	Feb 3, 2019	Recommendation Systemsreinforcement-learning	—Unverified	0
A Meta-MDP Approach to Exploration for Lifelong Reinforcement Learning	Feb 3, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Certified Reinforcement Learning with Logic Guidance	Feb 2, 2019	Decision MakingDecision Making Under Uncertainty	CodeCode Available	1
Learning User Preferences via Reinforcement Learning with Spatial Interface Valuing	Feb 2, 2019	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
When Collaborative Filtering Meets Reinforcement Learning	Feb 2, 2019	Collaborative FilteringInteractive Recommendation	—Unverified	0
Non-asymptotic Analysis of Biased Stochastic Approximation Scheme	Feb 2, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Visual Rationalizations in Deep Reinforcement Learning for Atari Games	Feb 1, 2019	Atari GamesDecision Making	—Unverified	0
Policy Consolidation for Continual Reinforcement Learning	Feb 1, 2019	Continual Learningcontinuous-control	CodeCode Available	0
Privacy Preserving Off-Policy Evaluation	Feb 1, 2019	Off-policy evaluationPrivacy Preserving	—Unverified	0
Competitive Experience Replay	Feb 1, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Action Representations for Reinforcement Learning	Feb 1, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Joint Entity Linking with Deep Reinforcement Learning	Feb 1, 2019	Deep Reinforcement LearningEntity Disambiguation	—Unverified	0
A Geometric Perspective on Optimal Representations for Reinforcement Learning	Jan 31, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
An Optimization Framework for Task Sequencing in Curriculum Learning	Jan 31, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Contrasting Exploration in Parameter and Action Space: A Zeroth-Order Optimization Perspective	Jan 31, 2019	continuous-controlContinuous Control	CodeCode Available	0
Tsallis Reinforcement Learning: A Unified Framework for Maximum Entropy Reinforcement Learning	Jan 31, 2019	MuJoCoreinforcement-learning	—Unverified	0
Addressing Sample Complexity in Visual Tasks Using HER and Hallucinatory GANs	Jan 31, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Successor Features Combine Elements of Model-Free and Model-based Reinforcement Learning	Jan 31, 2019	Decision Makingmodel	—Unverified	0
The Value Function Polytope in Reinforcement Learning	Jan 31, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Probability Functional Descent: A Unifying Perspective on GANs, Variational Inference, and Reinforcement Learning	Jan 30, 2019	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Privacy-preserving Q-Learning with Functional Noise in Continuous State Spaces	Jan 30, 2019	Privacy PreservingQ-Learning	CodeCode Available	0
A Comparative Analysis of Expected and Distributional Reinforcement Learning	Jan 30, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
Transfer in Deep Reinforcement Learning Using Successor Features and Generalised Policy Improvement	Jan 30, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Safe, Efficient, and Comfortable Velocity Control based on Reinforcement Learning for Autonomous Driving	Jan 29, 2019	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available	0

Show:10 25 50

← PrevPage 259 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified