Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12351–12400 of 15113 papers

Title	Date	Tasks	Status
An Actor-Critic-Attention Mechanism for Deep Reinforcement Learning in Multi-view Environments	Jul 19, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Delegative Reinforcement Learning: learning to avoid traps with a little help	Jul 19, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Combinatorial Keyword Recommendations for Sponsored Search with Deep Reinforcement Learning	Jul 18, 2019	ClusteringCombinatorial Optimization	—Unverified
Convolutional Reservoir Computing for World Models	Jul 18, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Self-Attentional Credit Assignment for Transfer in Reinforcement Learning	Jul 18, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Dynamical Distance Learning for Semi-Supervised and Unsupervised Skill Discovery	Jul 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
Prioritized Guidance for Efficient Multi-Agent Reinforcement Learning Exploration	Jul 18, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Photonic architecture for reinforcement learning	Jul 17, 2019	Active LearningQ-Learning	—Unverified
Zermelo's problem: Optimal point-to-point navigation in 2D turbulent flows using Reinforcement Learning	Jul 17, 2019	NavigateReinforcement Learning	—Unverified
CADS: Core-Aware Dynamic Scheduler for Multicore Memory Controllers	Jul 17, 2019	FairnessReinforcement Learning	—Unverified
An Inductive Synthesis Framework for Verifiable Reinforcement Learning	Jul 16, 2019	BIG-bench Machine Learningreinforcement-learning	—Unverified
Improved Reinforcement Learning through Imitation Learning Pretraining Towards Image-based Autonomous Driving	Jul 16, 2019	Autonomous DrivingDiversity	—Unverified
Model-free Control of Chaos with Continuous Deep Q-learning	Jul 16, 2019	Q-Learningreinforcement-learning	—Unverified
Ranking sentences from product description & bullets for better search	Jul 15, 2019	Extractive SummarizationNER	—Unverified
Mutual Reinforcement Learning	Jul 15, 2019	reinforcement-learningReinforcement Learning	—Unverified
PPO Dash: Improving Generalization in Deep Reinforcement Learning	Jul 15, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Federated Reinforcement Distillation with Proxy Experience Memory	Jul 15, 2019	Privacy Preservingreinforcement-learning	—Unverified
A Dual Memory Structure for Efficient Use of Replay Memory in Deep Reinforcement Learning	Jul 15, 2019	Deep Reinforcement LearningOpenAI Gym	—Unverified
Finite-Time Performance Bounds and Adaptive Learning Rate Selection for Two Time-Scale Reinforcement Learning	Jul 14, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Learning Self-Correctable Policies and Value Functions from Demonstrations with Negative Sampling	Jul 12, 2019	Imitation Learningreinforcement-learning	CodeCode Available
Environment Reconstruction with Hidden Confounders for Reinforcement Learning based Recommendation	Jul 12, 2019	Decision MakingImitation Learning	—Unverified
A Model-based Approach for Sample-efficient Multi-task Reinforcement Learning	Jul 11, 2019	continuous-controlContinuous Control	—Unverified
Imitation-Projected Programmatic Reinforcement Learning	Jul 11, 2019	continuous-controlContinuous Control	—Unverified
DisCoRL: Continual Reinforcement Learning via Policy Distillation	Jul 11, 2019	reinforcement-learningReinforcement Learning	—Unverified
Provably Efficient Reinforcement Learning with Linear Function Approximation	Jul 11, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning with Chromatic Networks for Compact Architecture Search	Jul 10, 2019	Combinatorial OptimizationNeural Architecture Search	—Unverified
Regularizing Neural Networks for Future Trajectory Prediction via Inverse Reinforcement Learning Framework	Jul 10, 2019	Decoderreinforcement-learning	CodeCode Available
DOB-Net: Actively Rejecting Unknown Excessive Time-Varying Disturbances	Jul 10, 2019	PositionReinforcement Learning	—Unverified
Interpretable Dynamics Models for Data-Efficient Reinforcement Learning	Jul 10, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement-Learning-based Driving Policy for Autonomous Road Vehicles	Jul 10, 2019	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Assessing Transferability from Simulation to Reality for Reinforcement Learning	Jul 10, 2019	reinforcement-learningReinforcement Learning	—Unverified
Capturing Financial markets to apply Deep Reinforcement Learning	Jul 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dreaming machine learning: Lipschitz extensions for reinforcement learning on financial markets	Jul 9, 2019	BIG-bench Machine Learningreinforcement-learning	—Unverified
Better-than-Demonstrator Imitation Learning via Automatically-Ranked Demonstrations	Jul 9, 2019	Imitation Learningreinforcement-learning	CodeCode Available
Variance-Based Risk Estimations in Markov Processes via Transformation with State Lumping	Jul 9, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
On-Policy Robot Imitation Learning from a Converging Supervisor	Jul 8, 2019	continuous-controlContinuous Control	—Unverified
Policy-Gradient Algorithms Have No Guarantees of Convergence in Linear Quadratic Games	Jul 8, 2019	reinforcement-learningReinforcement Learning	—Unverified
ShrinkML: End-to-End ASR Model Compression Using Reinforcement Learning	Jul 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Variational Inference MPC for Bayesian Model-based Reinforcement Learning	Jul 8, 2019	Bayesian InferenceModel-based Reinforcement Learning	—Unverified
Data Efficient Reinforcement Learning for Legged Robots	Jul 8, 2019	Model Predictive Controlreinforcement-learning	—Unverified
Deep Active Inference as Variational Policy Gradients	Jul 8, 2019	Bayesian Inferencereinforcement-learning	CodeCode Available
A Communication-Efficient Multi-Agent Actor-Critic Algorithm for Distributed Reinforcement Learning	Jul 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
Intrinsic Motivation Driven Intuitive Physics Learning using Deep Reinforcement Learning with Intrinsic Reward Normalization	Jul 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Playing Flappy Bird via Asynchronous Advantage Actor Critic Algorithm	Jul 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
On Inductive Biases in Deep Reinforcement Learning	Jul 5, 2019	continuous-controlContinuous Control	—Unverified
Self-supervised Learning of Distance Functions for Goal-Conditioned Reinforcement Learning	Jul 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning For Modeling Chit-Chat Dialog With Discrete Attributes	Jul 5, 2019	AttributeDeep Reinforcement Learning	—Unverified
Learning a Behavioral Repertoire from Demonstrations	Jul 5, 2019	Imitation LearningReinforcement Learning	—Unverified
Incrementally Learning Functions of the Return	Jul 5, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Attentive Multi-Task Deep Reinforcement Learning	Jul 5, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 248 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified