Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10851–10875 of 15113 papers

Title	Date	Tasks	Status
Zeroth-Order Supervised Policy Improvement	Jun 11, 2020	continuous-controlContinuous Control	—Unverified
Surveys without Questions: A Reinforcement Learning Approach	Jun 11, 2020	reinforcement-learningReinforcement Learning	—Unverified
Sample Efficient Reinforcement Learning via Low-Rank Matrix Estimation	Jun 11, 2020	Learning Theoryreinforcement-learning	—Unverified
Multi-Agent Informational Learning Processes	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Scalable Multi-Agent Reinforcement Learning for Networked Systems with Average Reward	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Off-Policy Risk-Sensitive Reinforcement Learning Based Constrained Robust Optimal Control	Jun 10, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Q-greedyUCB: a New Exploration Policy for Adaptive and Resource-efficient Scheduling	Jun 10, 2020	Decision MakingQ-Learning	—Unverified
Continuous Action Reinforcement Learning from a Mixture of Interpretable Experts	Jun 10, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Machine learning and control engineering: The model-free case	Jun 10, 2020	BIG-bench Machine Learningreinforcement-learning	—Unverified
Searching Learning Strategy with Reinforcement Learning for 3D Medical Image Segmentation	Jun 10, 2020	Data AugmentationImage Segmentation	—Unverified
Privacy-Cost Management in Smart Meters with Mutual Information-Based Reinforcement Learning	Jun 10, 2020	Deep Reinforcement LearningManagement	—Unverified
Multi-Agent Reinforcement Learning in a Realistic Limit Order Book Market Simulation	Jun 10, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Transient Non-Stationarity and Generalisation in Deep Reinforcement Learning	Jun 10, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Self-Supervised Reinforcement Learning for Recommender Systems	Jun 10, 2020	Q-LearningRecommendation Systems	—Unverified
Deep reinforcement learning for optical systems: A case study of mode-locked lasers	Jun 10, 2020	Deep Reinforcement LearningNavigate	—Unverified
Learning to Play Table Tennis From Scratch using Muscular Robots	Jun 10, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Development of A Stochastic Traffic Environment with Generative Time-Series Models for Improving Generalization Capabilities of Autonomous Driving Agents	Jun 10, 2020	Autonomous DrivingReinforcement Learning (RL)	—Unverified
Causal Discovery from Incomplete Data using An Encoder and Reinforcement Learning	Jun 9, 2020	Causal DiscoveryImputation	—Unverified
An overall view of key problems in algorithmic trading and recent progress	Jun 9, 2020	Algorithmic TradingBIG-bench Machine Learning	—Unverified
Distributed Learning on Heterogeneous Resource-Constrained Devices	Jun 9, 2020	Federated LearningReinforcement Learning (RL)	—Unverified
Stealing Deep Reinforcement Learning Models for Fun and Profit	Jun 9, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Policy-focused Agent-based Modeling using RL Behavioral Models	Jun 9, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
Online Learning in Iterated Prisoner's Dilemma to Mimic Human Behavior	Jun 9, 2020	Multi-Armed Banditsreinforcement-learning	CodeCode Available
Variational Model-based Policy Optimization	Jun 9, 2020	continuous-controlContinuous Control	—Unverified
Online Data Poisoning Attacks	Jun 8, 2020	Data PoisoningDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 435 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified