Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12151–12200 of 15113 papers

Title	Date	Tasks	Status
Towards an Adaptive Robot for Sports and Rehabilitation Coaching	Sep 13, 2019	reinforcement-learningReinforcement Learning	—Unverified
Modeling Sensorimotor Coordination as Multi-Agent Reinforcement Learning with Differentiable Communication	Sep 12, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for Portfolio Management	Sep 12, 2019	Data AugmentationManagement	CodeCode Available
Maximum Likelihood Constraint Inference for Inverse Reinforcement Learning	Sep 12, 2019	reinforcement-learningReinforcement Learning	—Unverified
Efficiently Breaking the Curse of Horizon in Off-Policy Evaluation with Double Reinforcement Learning	Sep 12, 2019	Off-policy evaluationreinforcement-learning	—Unverified
Joint Inference of Reward Machines and Policies for Reinforcement Learning	Sep 12, 2019	Q-Learningreinforcement-learning	—Unverified
Correlation Priors for Reinforcement Learning	Sep 11, 2019	Decision MakingImitation Learning	—Unverified
Reinforcement Learning Models of Human Behavior: Reward Processing in Mental Disorders	Sep 11, 2019	Decision MakingQ-Learning	—Unverified
RecSim: A Configurable Simulation Platform for Recommender Systems	Sep 11, 2019	Interactive RecommendationRecommendation Systems	CodeCode Available
Mutual-Information Regularization in Markov Decision Processes and Actor-Critic Learning	Sep 11, 2019	MuJoCoQ-Learning	—Unverified
Modelling Working Memory using Deep Recurrent Reinforcement Learning	Sep 11, 2019	Decision Makingreinforcement-learning	—Unverified
Predicting optimal value functions by interpolating reward functions in scalarized multi-objective reinforcement learning	Sep 11, 2019	Autonomous VehiclesMulti-Objective Reinforcement Learning	CodeCode Available
On Memory Mechanism in Multi-Agent Reinforcement Learning	Sep 11, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Transfer of Temporal Logic Formulas in Reinforcement Learning	Sep 10, 2019	reinforcement-learningReinforcement Learning	—Unverified
Q-Learning Based Aerial Base Station Placement for Fairness Enhancement in Mobile Networks	Sep 10, 2019	FairnessQ-Learning	—Unverified
Signal Instructed Coordination in Cooperative Multi-agent Reinforcement Learning	Sep 10, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
MAT: Multi-Fingered Adaptive Tactile Grasping via Deep Reinforcement Learning	Sep 10, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning and Video Games	Sep 10, 2019	Atari GamesDeep Learning	—Unverified
Sampling Strategies for GAN Synthetic Data	Sep 10, 2019	AttributeDiversity	—Unverified
Discovery of Useful Questions as Auxiliary Tasks	Sep 10, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning Algorithm for Dynamic Pricing of Express Lanes with Multiple Access Locations	Sep 10, 2019	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Learning Transferable Domain Priors for Safe Exploration in Reinforcement Learning	Sep 10, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Survey on Reproducibility by Evaluating Deep Reinforcement Learning Algorithms on Real-World Robots	Sep 9, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Clickbait? Sensational Headline Generation with Auto-tuned Reinforcement Learning	Sep 9, 2019	Headline Generationreinforcement-learning	CodeCode Available
Exploratory Combinatorial Optimization with Reinforcement Learning	Sep 9, 2019	Combinatorial Optimizationreinforcement-learning	CodeCode Available
AC-Teach: A Bayesian Actor-Critic Method for Policy Learning with an Ensemble of Suboptimal Teachers	Sep 9, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
DEAR: Deep Reinforcement Learning for Online Advertising Impression in Recommender Systems	Sep 9, 2019	ArticlesDeep Reinforcement Learning	—Unverified
Fixed-Horizon Temporal Difference Methods for Stable Reinforcement Learning	Sep 9, 2019	Q-Learningreinforcement-learning	—Unverified
Deterministic Value-Policy Gradients	Sep 9, 2019	continuous-controlContinuous Control	—Unverified
Solving Continual Combinatorial Selection via Deep Reinforcement Learning	Sep 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Recommendation System-based Upper Confidence Bound for Online Advertising	Sep 9, 2019	OpenAI GymProduct Recommendation	—Unverified
Off-Policy Evaluation in Partially Observable Environments	Sep 9, 2019	Off-policy evaluationReinforcement Learning	—Unverified
Partner Approximating Learners (PAL): Simulation-Accelerated Learning with Explicit Partner Modeling in Multi-Agent Domains	Sep 9, 2019	reinforcement-learningReinforcement Learning	—Unverified
Neural Architecture Search in Embedding Space	Sep 9, 2019	GPUimage-classification	—Unverified
Option Encoder: A Framework for Discovering a Policy Basis in Reinforcement Learning	Sep 9, 2019	reinforcement-learningReinforcement Learning	—Unverified
Self-driving scale car trained by Deep reinforcement learning	Sep 8, 2019	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Personalized HeartSteps: A Reinforcement Learning Algorithm for Optimizing Physical Activity	Sep 8, 2019	reinforcement-learningReinforcement Learning	—Unverified
Imitation Learning for Human Pose Prediction	Sep 8, 2019	Deep Reinforcement LearningHuman Pose Forecasting	—Unverified
Deep Reinforcement Learning for Control of Probabilistic Boolean Networks	Sep 7, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available
Automatic Financial Trading Agent for Low-risk Portfolio Management using Deep Reinforcement Learning	Sep 7, 2019	Deep Reinforcement LearningManagement	—Unverified
Regularized Anderson Acceleration for Off-Policy Deep Reinforcement Learning	Sep 7, 2019	Deep Reinforcement LearningMuJoCo	CodeCode Available
Soft Policy Gradient Method for Maximum Entropy Deep Reinforcement Learning	Sep 7, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Gradient Q(σ, λ): A Unified Algorithm with Function Approximation for Reinforcement Learning	Sep 6, 2019	Q-LearningReinforcement Learning	—Unverified
Blackbox Attacks on Reinforcement Learning Agents Using Approximated Temporal Information	Sep 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
DRLViz: Understanding Decisions and Memory in Deep Reinforcement Learning	Sep 6, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Efficient Communication in Multi-Agent Reinforcement Learning via Variance Based Control	Sep 6, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Building Task-Oriented Visual Dialog Systems Through Alternative Optimization Between Dialog Policy and Language Generation	Sep 6, 2019	DecoderReinforcement Learning	—Unverified
Reinforcement Learning for Joint Optimization of Multiple Rewards	Sep 6, 2019	Decision MakingFairness	—Unverified
Adaptive Trust Region Policy Optimization: Global Convergence and Faster Rates for Regularized MDPs	Sep 6, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Classification with Costly Features as a Sequential Decision-Making Problem	Sep 5, 2019	ClassificationClassification with Costly Features	CodeCode Available

Show:10 25 50

← PrevPage 244 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified