Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12951–13000 of 15113 papers

Title	Date	Tasks	Status	Hype
Trust Region-Guided Proximal Policy Optimization	Jan 29, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	0
Multi-Agent Reinforcement Learning with Multi-Step Generative Models	Jan 29, 2019	continuous-controlContinuous Control	—Unverified	0
Self-organization of action hierarchy and compositionality by reinforcement learning with recurrent neural networks	Jan 29, 2019	continuous-controlContinuous Control	CodeCode Available	0
A Regulation Enforcement Solution for Multi-agent Reinforcement Learning	Jan 29, 2019	AI AgentManagement	—Unverified	0
Designing a Multi-Objective Reward Function for Creating Teams of Robotic Bodyguards Using Deep Reinforcement Learning	Jan 28, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
CLIC: Curriculum Learning and Imitation for object Control in non-rewarding environments	Jan 28, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Reward Shaping via Meta-Learning	Jan 27, 2019	Meta-LearningReinforcement Learning	—Unverified	0
Value Propagation for Decentralized Networked Deep Multi-agent Reinforcement Learning	Jan 27, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Off-Policy Deep Reinforcement Learning by Bootstrapping the Covariate Shift	Jan 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Probabilistic Recursive Reasoning for Multi-Agent Reinforcement Learning	Jan 26, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Action Robust Reinforcement Learning and Applications in Continuous Control	Jan 26, 2019	continuous-controlContinuous Control	CodeCode Available	0
Emergent Linguistic Phenomena in Multi-Agent Communication Games	Jan 25, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	0
Model-based Deep Reinforcement Learning for Dynamic Portfolio Optimization	Jan 25, 2019	Data AugmentationDeep Reinforcement Learning	—Unverified	0
Learning agile and dynamic motor skills for legged robots	Jan 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Decoupling feature extraction from policy learning: assessing benefits of state representation learning in goal based robotics	Jan 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Feudal Multi-Agent Hierarchies for Cooperative Reinforcement Learning	Jan 24, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Dynamic Measurement Scheduling for Event Forecasting using Deep RL	Jan 24, 2019	Deep Reinforcement LearningICU Mortality	CodeCode Available	0
Federated Deep Reinforcement Learning	Jan 24, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Sample Complexity of Estimating the Policy Gradient for Nearly Deterministic Dynamical Systems	Jan 24, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Phonetic-enriched Text Representation for Chinese Sentiment Analysis with Reinforcement Learning	Jan 23, 2019	Chinese Sentiment Analysisreinforcement-learning	—Unverified	0
Reinforcement Learning of Markov Decision Processes with Peak Constraints	Jan 23, 2019	Q-Learningreinforcement-learning	—Unverified	0
The Multi-Agent Reinforcement Learning in MalmÖ (MARLÖ) Competition	Jan 23, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Hierarchical Reinforcement Learning for Multi-agent MOBA Game	Jan 23, 2019	Hierarchical Reinforcement LearningImitation Learning	—Unverified	0
Distillation Strategies for Proximal Policy Optimization	Jan 23, 2019	Deep Reinforcement LearningQ-Learning	—Unverified	0
Causal Reasoning from Meta-reinforcement Learning	Jan 23, 2019	counterfactualMeta Reinforcement Learning	CodeCode Available	0
Towards Learning to Imitate from a Single Video Demonstration	Jan 22, 2019	Imitation LearningOne-Shot Learning	—Unverified	0
Understanding Multi-Step Deep Reinforcement Learning: A Systematic Study of the DQN Target	Jan 22, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available	0
Robust Recovery Controller for a Quadrupedal Robot using Deep Reinforcement Learning	Jan 22, 2019	Deep Reinforcement LearningNavigate	—Unverified	0
Fast, Accurate and Lightweight Super-Resolution with Neural Architecture Search	Jan 22, 2019	Neural Architecture SearchReinforcement Learning	CodeCode Available	0
A Short Survey on Probabilistic Reinforcement Learning	Jan 21, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Read, Watch, and Move: Reinforcement Learning for Temporally Grounding Natural Language Descriptions in Videos	Jan 21, 2019	Decision MakingMulti-Task Learning	CodeCode Available	0
Towards Physically Safe Reinforcement Learning under Supervision	Jan 19, 2019	OpenAI Gymreinforcement-learning	—Unverified	0
Lifelong Federated Reinforcement Learning: A Learning Architecture for Navigation in Cloud Robotic Systems	Jan 19, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
On-Policy Trust Region Policy Optimisation with Replay Buffers	Jan 18, 2019	Continuous ControlDeep Reinforcement Learning	CodeCode Available	0
WALL-E: An Efficient Reinforcement Learning Research Framework	Jan 18, 2019	MuJoCoreinforcement-learning	CodeCode Available	0
Multi-agent Reinforcement Learning Embedded Game for the Optimization of Building Energy Control and Power System Planning	Jan 17, 2019	ManagementMulti-agent Reinforcement Learning	—Unverified	0
Amplifying the Imitation Effect for Reinforcement Learning of UCAV's Mission Execution	Jan 17, 2019	Imitation Learningreinforcement-learning	CodeCode Available	0
Evolutionarily-Curated Curriculum Learning for Deep Reinforcement Learning Agents	Jan 16, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Representation Learning on Graphs: A Reinforcement Learning Application	Jan 16, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Transfer Learning for Prosthetics Using Imitation Learning	Jan 15, 2019	BenchmarkingImitation Learning	CodeCode Available	0
Energy-Efficient Thermal Comfort Control in Smart Buildings via Deep Reinforcement Learning	Jan 15, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Improving Sepsis Treatment Strategies by Combining Deep and Kernel-Based Reinforcement Learning	Jan 15, 2019	Deep Reinforcement LearningMixture-of-Experts	—Unverified	0
Comparing Knowledge-based Reinforcement Learning to Neural Networks in a Strategy Game	Jan 15, 2019	Game of Goreinforcement-learning	—Unverified	0
AutoPhase: Compiler Phase-Ordering for High Level Synthesis with Deep Reinforcement Learning	Jan 15, 2019	Deep Reinforcement LearningHigh-Level Synthesis	CodeCode Available	1
Improving Coordination in Small-Scale Multi-Agent Deep Reinforcement Learning through Memory-driven Communication	Jan 12, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	0
An investigation of model-free planning	Jan 11, 2019	Inductive Biasmodel	CodeCode Available	0
On the Global Convergence of Imitation Learning: A Case for Linear Quadratic Regulator	Jan 11, 2019	Imitation Learningreinforcement-learning	—Unverified	0
Low Level Control of a Quadrotor with Deep Model-Based Reinforcement Learning	Jan 11, 2019	GPUModel-based Reinforcement Learning	—Unverified	0
Motion Perception in Reinforcement Learning with Dynamic Objects	Jan 10, 2019	continuous-controlContinuous Control	—Unverified	0
A New Tensioning Method using Deep Reinforcement Learning for Surgical Pattern Cutting	Jan 10, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 260 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified