Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13001–13050 of 15113 papers

Title	Date	Tasks	Status
POPO: Pessimistic Offline Policy Optimization	Dec 26, 2020	Offline RLQ-Learning	CodeCode Available
Off-Policy Deep Reinforcement Learning with Analogous Disentangled Exploration	Feb 25, 2020	continuous-controlContinuous Control	CodeCode Available
The Dreaming Variational Autoencoder for Reinforcement Learning Environments	Oct 2, 2018	Managementreinforcement-learning	CodeCode Available
Modular Deep Reinforcement Learning with Temporal Logic Specifications	Sep 23, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Off-Policy Correction For Multi-Agent Reinforcement Learning	Nov 22, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Meta-Reinforcement Learning by Tracking Task Non-stationarity	May 18, 2021	Meta Reinforcement Learningreinforcement-learning	CodeCode Available
MCTS-GEB: Monte Carlo Tree Search is a Good E-graph Builder	Mar 8, 2023	graph constructionReinforcement Learning (RL)	CodeCode Available
Pontryagin Optimal Control via Neural Networks	Dec 30, 2022	Model-based Reinforcement LearningMuJoCo	CodeCode Available
The Effects of Memory Replay in Reinforcement Learning	Oct 18, 2017	Deep Reinforcement LearningQ-Learning	CodeCode Available
Meta reinforcement learning as task inference	May 15, 2019	continuous-controlContinuous Control	CodeCode Available
Risk-sensitive control as inference with Rényi divergence	Nov 4, 2024	Reinforcement Learning (RL)Variational Inference	CodeCode Available
POMDP inference and robust solution via deep reinforcement learning: An application to railway optimal maintenance	Jul 16, 2023	Decision MakingDeep Reinforcement Learning	CodeCode Available
Policy Teaching via Environment Poisoning: Training-time Adversarial Attacks against Reinforcement Learning	Mar 28, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Risk-sensitive Inverse Reinforcement Learning via Semi- and Non-Parametric Methods	Nov 28, 2017	Decision Makingreinforcement-learning	CodeCode Available
MazeBase: A Sandbox for Learning from Games	Nov 23, 2015	NegationReinforcement Learning	CodeCode Available
Policy Search with Rare Significant Events: Choosing the Right Partner to Cooperate with	Mar 11, 2021	Evolutionary Algorithmsreinforcement-learning	CodeCode Available
Reinforcement Learning in a Physics-Inspired Semi-Markov Environment	Apr 15, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Mitigating Off-Policy Bias in Actor-Critic Methods with One-Step Q-learning: A Novel Correction Approach	Aug 1, 2022	continuous-controlContinuous Control	CodeCode Available
Policy Poisoning in Batch Reinforcement Learning and Control	Oct 13, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Learning Socially Appropriate Robot Approaching Behavior Toward Groups using Deep Reinforcement Learning	Oct 16, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Tracking Object Positions in Reinforcement Learning: A Metric for Keypoint Detection (extended version)	Dec 1, 2023	Keypoint DetectionReinforcement Learning (RL)	CodeCode Available
Policy Mirror Descent with Lookahead	Mar 21, 2024	Reinforcement Learning (RL)	CodeCode Available
Markov Abstractions for PAC Reinforcement Learning in Non-Markov Decision Processes	Apr 29, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Social learning spontaneously emerges by searching optimal heuristics with deep reinforcement learning	Apr 26, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Socially Aware Motion Planning with Deep Reinforcement Learning	Mar 26, 2017	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available
RL^2: Fast Reinforcement Learning via Slow Reinforcement Learning	Nov 9, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Universally Expressive Communication in Multi-Agent Reinforcement Learning	Jun 14, 2022	Graph LearningMulti-agent Reinforcement Learning	CodeCode Available
Socially Intelligent Genetic Agents for the Emergence of Explicit Norms	Aug 7, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Reinforcement Learning Guided Multi-Objective Exam Paper Generation	Mar 2, 2023	Knowledge TracingPaper generation	CodeCode Available
Policy Learning Using Weak Supervision	Oct 5, 2020	Reinforcement Learning (RL)	CodeCode Available
Universal Policies to Learn Them All	Aug 24, 2019	AllMulti-agent Reinforcement Learning	CodeCode Available
Reinforcement Learning Guided by Provable Normative Compliance	Mar 30, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning Generalization with Surprise Minimization	Apr 26, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Tractable Reinforcement Learning of Signal Temporal Logic Objectives	Jan 26, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Universal Reinforcement Learning Algorithms: Survey and Experiments	May 30, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
RL and Fingerprinting to Select Moving Target Defense Mechanisms for Zero-day Attacks in IoT	Dec 30, 2022	CPUReinforcement Learning (RL)	CodeCode Available
Muscle Excitation Estimation in Biomechanical Simulation Using NAF Reinforcement Learning	Sep 17, 2018	Deep Reinforcement LearningPoint Tracking	CodeCode Available
Policy Learning for Malaria Control	Oct 20, 2019	Bayesian OptimizationDecision Making	CodeCode Available
Policy Information Capacity: Information-Theoretic Measure for Task Complexity in Deep Reinforcement Learning	Mar 23, 2021	continuous-controlContinuous Control	CodeCode Available
Soft Actor-Critic for Discrete Action Settings	Oct 16, 2019	Atari Gamesreinforcement-learning	CodeCode Available
Policy-GNN: Aggregation Optimization for Graph Neural Networks	Jun 26, 2020	Deep Reinforcement LearningNode Classification	CodeCode Available
Soft Actor-Critic with Cross-Entropy Policy Optimization	Dec 21, 2021	Reinforcement Learning (RL)	CodeCode Available
Combining Reconstruction and Contrastive Methods for Multimodal Representations in RL	Feb 10, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Universal Successor Features Approximators	Dec 18, 2018	NavigateReinforcement Learning	CodeCode Available
Market Making via Reinforcement Learning	Apr 11, 2018	Positionreinforcement-learning	CodeCode Available
RLCard: A Toolkit for Reinforcement Learning in Card Games	Oct 10, 2019	Board GamesCard Games	CodeCode Available
Lucid Dreaming for Experience Replay: Refreshing Past States with the Current Policy	Sep 29, 2020	Atari GamesReinforcement Learning (RL)	CodeCode Available
Multi-View Reinforcement Learning	Oct 18, 2019	Decision Makingreinforcement-learning	CodeCode Available
Policy Distillation	Nov 19, 2015	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Policy Continuation with Hindsight Inverse Dynamics	Oct 30, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available

Show:10 25 50

← PrevPage 261 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified