Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10901–10925 of 15113 papers

Title	Date	Tasks	Status
Balancing Reinforcement Learning Training Experiences in Interactive Information Retrieval	Jun 5, 2020	Information Retrievalreinforcement-learning	—Unverified
AutoHAS: Efficient Hyperparameter and Architecture Search	Jun 5, 2020	AutoMLHyperparameter Optimization	—Unverified
State Action Separable Reinforcement Learning	Jun 5, 2020	Decision Makingreinforcement-learning	—Unverified
Refined Continuous Control of DDPG Actors via Parametrised Activation	Jun 4, 2020	continuous-controlContinuous Control	—Unverified
Visual Transfer for Reinforcement Learning via Wasserstein Domain Confusion	Jun 4, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Meta-Model-Based Meta-Policy Optimization	Jun 4, 2020	continuous-controlContinuous Control	—Unverified
Constrained Reinforcement Learning for Dynamic Optimization under Uncertainty	Jun 4, 2020	reinforcement-learningReinforcement Learning	—Unverified
A Novel Update Mechanism for Q-Networks Based On Extreme Learning Machines	Jun 4, 2020	Q-Learningreinforcement-learning	CodeCode Available
Causality and Batch Reinforcement Learning: Complementary Approaches To Planning In Unknown Domains	Jun 3, 2020	Autonomous DrivingCausal Inference	—Unverified
Learning to Scan: A Deep Reinforcement Learning Approach for Personalized Scanning in CT Imaging	Jun 3, 2020	compressed sensingComputed Tomography (CT)	—Unverified
The Value-Improvement Path: Towards Better Representations for Reinforcement Learning	Jun 3, 2020	Atari Gamesreinforcement-learning	—Unverified
Temporally-Extended ε-Greedy Exploration	Jun 2, 2020	Reinforcement Learning (RL)	CodeCode Available
Diversity Actor-Critic: Sample-Aware Entropy Regularization for Sample-Efficient Exploration	Jun 2, 2020	DiversityEfficient Exploration	CodeCode Available
Jointly Learning Environments and Control Policies with Projected Stochastic Gradient Ascent	Jun 2, 2020	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Active Vision for Early Recognition of Human Actions	Jun 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
A novel approach for multi-agent cooperative pursuit to capture grouped evaders	Jun 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement learning and Bayesian data assimilation for model-informed precision dosing in oncology	Jun 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Mitigating Bias in Face Recognition Using Skewness-Aware Reinforcement Learning	Jun 1, 2020	Face RecognitionFairness	—Unverified
Temporal-Differential Learning in Continuous Environments	Jun 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Robust Reinforcement Learning with Wasserstein Constraint	Jun 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Model-Based Reinforcement Learning with Value-Targeted Regression	Jun 1, 2020	modelModel-based Reinforcement Learning	—Unverified
Variational Reward Estimator Bottleneck: Learning Robust Reward Estimator for Multi-Domain Task-Oriented Dialog	May 31, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
MM-KTD: Multiple Model Kalman Temporal Differences for Reinforcement Learning	May 30, 2020	Active Learningreinforcement-learning	CodeCode Available
Reinforcement Learning	May 29, 2020	Autonomous VehiclesBoard Games	CodeCode Available
AI-based Resource Allocation: Reinforcement Learning for Adaptive Auto-scaling in Serverless Environments	May 29, 2020	Cloud ComputingManagement	—Unverified

Show:10 25 50

← PrevPage 437 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified