Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10901–10950 of 15113 papers

Title	Date	Tasks	Status
Balancing Reinforcement Learning Training Experiences in Interactive Information Retrieval	Jun 5, 2020	Information Retrievalreinforcement-learning	—Unverified
AutoHAS: Efficient Hyperparameter and Architecture Search	Jun 5, 2020	AutoMLHyperparameter Optimization	—Unverified
State Action Separable Reinforcement Learning	Jun 5, 2020	Decision Makingreinforcement-learning	—Unverified
Refined Continuous Control of DDPG Actors via Parametrised Activation	Jun 4, 2020	continuous-controlContinuous Control	—Unverified
Visual Transfer for Reinforcement Learning via Wasserstein Domain Confusion	Jun 4, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Meta-Model-Based Meta-Policy Optimization	Jun 4, 2020	continuous-controlContinuous Control	—Unverified
Constrained Reinforcement Learning for Dynamic Optimization under Uncertainty	Jun 4, 2020	reinforcement-learningReinforcement Learning	—Unverified
A Novel Update Mechanism for Q-Networks Based On Extreme Learning Machines	Jun 4, 2020	Q-Learningreinforcement-learning	CodeCode Available
Causality and Batch Reinforcement Learning: Complementary Approaches To Planning In Unknown Domains	Jun 3, 2020	Autonomous DrivingCausal Inference	—Unverified
Learning to Scan: A Deep Reinforcement Learning Approach for Personalized Scanning in CT Imaging	Jun 3, 2020	compressed sensingComputed Tomography (CT)	—Unverified
The Value-Improvement Path: Towards Better Representations for Reinforcement Learning	Jun 3, 2020	Atari Gamesreinforcement-learning	—Unverified
Temporally-Extended ε-Greedy Exploration	Jun 2, 2020	Reinforcement Learning (RL)	CodeCode Available
Diversity Actor-Critic: Sample-Aware Entropy Regularization for Sample-Efficient Exploration	Jun 2, 2020	DiversityEfficient Exploration	CodeCode Available
Jointly Learning Environments and Control Policies with Projected Stochastic Gradient Ascent	Jun 2, 2020	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Active Vision for Early Recognition of Human Actions	Jun 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
A novel approach for multi-agent cooperative pursuit to capture grouped evaders	Jun 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement learning and Bayesian data assimilation for model-informed precision dosing in oncology	Jun 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Mitigating Bias in Face Recognition Using Skewness-Aware Reinforcement Learning	Jun 1, 2020	Face RecognitionFairness	—Unverified
Temporal-Differential Learning in Continuous Environments	Jun 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Robust Reinforcement Learning with Wasserstein Constraint	Jun 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Model-Based Reinforcement Learning with Value-Targeted Regression	Jun 1, 2020	modelModel-based Reinforcement Learning	—Unverified
Variational Reward Estimator Bottleneck: Learning Robust Reward Estimator for Multi-Domain Task-Oriented Dialog	May 31, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
MM-KTD: Multiple Model Kalman Temporal Differences for Reinforcement Learning	May 30, 2020	Active Learningreinforcement-learning	CodeCode Available
Reinforcement Learning	May 29, 2020	Autonomous VehiclesBoard Games	CodeCode Available
AI-based Resource Allocation: Reinforcement Learning for Adaptive Auto-scaling in Serverless Environments	May 29, 2020	Cloud ComputingManagement	—Unverified
Domain Knowledge Integration By Gradient Matching For Sample-Efficient Reinforcement Learning	May 28, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Intelligent Residential Energy Management System using Deep Reinforcement Learning	May 28, 2020	Deep Reinforcement Learningenergy management	—Unverified
Revisiting Parameter Sharing in Multi-Agent Deep Reinforcement Learning	May 27, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available
Time-Variant Variational Transfer for Value Functions	May 26, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Towards intervention-centric causal reasoning in learning agents	May 26, 2020	Deep Reinforcement LearningMeta-Learning	—Unverified
Anomaly Detection Under Controlled Sensing Using Actor-Critic Reinforcement Learning	May 26, 2020	Anomaly DetectionDecision Making	—Unverified
A reinforcement learning approach to rare trajectory sampling	May 26, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
ALBA : Reinforcement Learning for Video Object Segmentation	May 26, 2020	ObjectOne-shot visual object segmentation	CodeCode Available
Integrating LEO Satellite and UAV Relaying via Reinforcement Learning for Non-Terrestrial Networks	May 26, 2020	Deep Reinforcement LearningDimensionality Reduction	—Unverified
Active Measure Reinforcement Learning for Observation Cost Minimization	May 26, 2020	Decision MakingQ-Learning	—Unverified
Breaking the Sample Size Barrier in Model-Based Reinforcement Learning with a Generative Model	May 26, 2020	modelModel-based Reinforcement Learning	—Unverified
Efficient Use of heuristics for accelerating XCS-based Policy Learning in Markov Games	May 26, 2020	Reinforcement Learning (RL)	—Unverified
Gradient Monitored Reinforcement Learning	May 25, 2020	Atari Gamescontinuous-control	—Unverified
Generator and Critic: A Deep Reinforcement Learning Approach for Slate Re-ranking in E-commerce	May 25, 2020	Deep Reinforcement LearningDiversity	—Unverified
Dynamic Value Estimation for Single-Task Multi-Scene Reinforcement Learning	May 25, 2020	ClusteringDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning Based Power Allocation for D2D Network	May 25, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Deep Learning Models for Automatic Summarization	May 25, 2020	Deep Learningreinforcement-learning	—Unverified
Policy Entropy for Out-of-Distribution Classification	May 25, 2020	BenchmarkingClassification	—Unverified
Optimization-driven Deep Reinforcement Learning for Robust Beamforming in IRS-assisted Wireless Communications	May 25, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Meta-Reinforcement Learning for Trajectory Design in Wireless UAV Networks	May 25, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified
Reinforcement Learning with Iterative Reasoning for Merging in Dense Traffic	May 25, 2020	Autonomous Vehiclesreinforcement-learning	—Unverified
Model-free Reinforcement Learning for Stochastic Stackelberg Security Games	May 24, 2020	reinforcement-learningReinforcement Learning	—Unverified
GoChat: Goal-oriented Chatbots with Hierarchical Reinforcement Learning	May 24, 2020	ChatbotHierarchical Reinforcement Learning	—Unverified
Automatic Discovery of Interpretable Planning Strategies	May 24, 2020	ClusteringDecision Making	CodeCode Available
Evaluating Generalisation in General Video Game Playing	May 22, 2020	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 219 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified