Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12201–12250 of 15113 papers

Title	Date	Tasks	Status	Hype
CADS: Core-Aware Dynamic Scheduler for Multicore Memory Controllers	Jul 17, 2019	FairnessReinforcement Learning	—Unverified	0
An Inductive Synthesis Framework for Verifiable Reinforcement Learning	Jul 16, 2019	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Improved Reinforcement Learning through Imitation Learning Pretraining Towards Image-based Autonomous Driving	Jul 16, 2019	Autonomous DrivingDiversity	—Unverified	0
Model-free Control of Chaos with Continuous Deep Q-learning	Jul 16, 2019	Q-Learningreinforcement-learning	—Unverified	0
Mutual Reinforcement Learning	Jul 15, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
PPO Dash: Improving Generalization in Deep Reinforcement Learning	Jul 15, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Ranking sentences from product description & bullets for better search	Jul 15, 2019	Extractive SummarizationNER	—Unverified	0
Federated Reinforcement Distillation with Proxy Experience Memory	Jul 15, 2019	Privacy Preservingreinforcement-learning	—Unverified	0
A Dual Memory Structure for Efficient Use of Replay Memory in Deep Reinforcement Learning	Jul 15, 2019	Deep Reinforcement LearningOpenAI Gym	—Unverified	0
Finite-Time Performance Bounds and Adaptive Learning Rate Selection for Two Time-Scale Reinforcement Learning	Jul 14, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Learning Self-Correctable Policies and Value Functions from Demonstrations with Negative Sampling	Jul 12, 2019	Imitation Learningreinforcement-learning	CodeCode Available	0
Environment Reconstruction with Hidden Confounders for Reinforcement Learning based Recommendation	Jul 12, 2019	Decision MakingImitation Learning	—Unverified	0
Collaborative Multi-Agent Dialogue Model Training Via Reinforcement Learning	Jul 11, 2019	Natural Language Understandingreinforcement-learning	CodeCode Available	1
Imitation-Projected Programmatic Reinforcement Learning	Jul 11, 2019	continuous-controlContinuous Control	—Unverified	0
A Model-based Approach for Sample-efficient Multi-task Reinforcement Learning	Jul 11, 2019	continuous-controlContinuous Control	—Unverified	0
DisCoRL: Continual Reinforcement Learning via Policy Distillation	Jul 11, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Provably Efficient Reinforcement Learning with Linear Function Approximation	Jul 11, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Reinforcement Learning with Chromatic Networks for Compact Architecture Search	Jul 10, 2019	Combinatorial OptimizationNeural Architecture Search	—Unverified	0
Interpretable Dynamics Models for Data-Efficient Reinforcement Learning	Jul 10, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
DOB-Net: Actively Rejecting Unknown Excessive Time-Varying Disturbances	Jul 10, 2019	PositionReinforcement Learning	—Unverified	0
Deep Reinforcement-Learning-based Driving Policy for Autonomous Road Vehicles	Jul 10, 2019	Autonomous VehiclesDeep Reinforcement Learning	—Unverified	0
Assessing Transferability from Simulation to Reality for Reinforcement Learning	Jul 10, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Regularizing Neural Networks for Future Trajectory Prediction via Inverse Reinforcement Learning Framework	Jul 10, 2019	Decoderreinforcement-learning	CodeCode Available	0
An Optimistic Perspective on Offline Reinforcement Learning	Jul 10, 2019	Atari GamesDiversity	CodeCode Available	1
Variance-Based Risk Estimations in Markov Processes via Transformation with State Lumping	Jul 9, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Dreaming machine learning: Lipschitz extensions for reinforcement learning on financial markets	Jul 9, 2019	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Capturing Financial markets to apply Deep Reinforcement Learning	Jul 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Better-than-Demonstrator Imitation Learning via Automatically-Ranked Demonstrations	Jul 9, 2019	Imitation Learningreinforcement-learning	CodeCode Available	0
Variational Inference MPC for Bayesian Model-based Reinforcement Learning	Jul 8, 2019	Bayesian InferenceModel-based Reinforcement Learning	—Unverified	0
On-Policy Robot Imitation Learning from a Converging Supervisor	Jul 8, 2019	continuous-controlContinuous Control	—Unverified	0
Policy-Gradient Algorithms Have No Guarantees of Convergence in Linear Quadratic Games	Jul 8, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
ShrinkML: End-to-End ASR Model Compression Using Reinforcement Learning	Jul 8, 2019	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Deep Active Inference as Variational Policy Gradients	Jul 8, 2019	Bayesian Inferencereinforcement-learning	CodeCode Available	0
Data Efficient Reinforcement Learning for Legged Robots	Jul 8, 2019	Model Predictive Controlreinforcement-learning	—Unverified	0
A Communication-Efficient Multi-Agent Actor-Critic Algorithm for Distributed Reinforcement Learning	Jul 6, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Intrinsic Motivation Driven Intuitive Physics Learning using Deep Reinforcement Learning with Intrinsic Reward Normalization	Jul 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Playing Flappy Bird via Asynchronous Advantage Actor Critic Algorithm	Jul 6, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Incrementally Learning Functions of the Return	Jul 5, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Deep Reinforcement Learning For Modeling Chit-Chat Dialog With Discrete Attributes	Jul 5, 2019	AttributeDeep Reinforcement Learning	—Unverified	0
Attentive Multi-Task Deep Reinforcement Learning	Jul 5, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Learning a Behavioral Repertoire from Demonstrations	Jul 5, 2019	Imitation LearningReinforcement Learning	—Unverified	0
Self-supervised Learning of Distance Functions for Goal-Conditioned Reinforcement Learning	Jul 5, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
On Inductive Biases in Deep Reinforcement Learning	Jul 5, 2019	continuous-controlContinuous Control	—Unverified	0
Safe Approximate Dynamic Programming Via Kernelized Lipschitz Estimation	Jul 3, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Integration of Imitation Learning using GAIL and Reinforcement Learning using Task-achievement Rewards via Probabilistic Graphical Model	Jul 3, 2019	General KnowledgeImitation Learning	—Unverified	0
Benchmarking Model-Based Reinforcement Learning	Jul 3, 2019	Benchmarkingmodel	CodeCode Available	0
Reasoning and Generalization in RL: A Tool Use Perspective	Jul 3, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Perspective Taking in Deep Reinforcement Learning Agents	Jul 3, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
On the Weaknesses of Reinforcement Learning for Neural Machine Translation	Jul 3, 2019	Machine Translationreinforcement-learning	—Unverified	0
Playing Go without Game Tree Search Using Convolutional Neural Networks	Jul 2, 2019	Game of Goreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 245 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified