Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4201–4225 of 15113 papers

Title	Date	Tasks	Status	Score
Towards Scalable Verification of Deep Reinforcement Learning	May 25, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Towards Similarity Graphs Constructed by Deep Reinforcement Learning	Nov 27, 2019	Deep Reinforcement Learninggraph construction	CodeCode Available	5
Reinforcement Learning with Dual-Observation for General Video Game Playing	Nov 11, 2020	Decision Makingreinforcement-learning	CodeCode Available	5
Robust Reinforcement Learning in Continuous Control Tasks with Uncertainty Set Regularization	Jul 5, 2022	continuous-controlContinuous Control	CodeCode Available	5
Robust Reinforcement Learning Objectives for Sequential Recommender Systems	May 30, 2023	Offline RLRecommendation Systems	CodeCode Available	5
Towards Solving Text-based Games by Producing Adaptive Action Spaces	Dec 3, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Towards Symbolic Reinforcement Learning with Common Sense	Apr 23, 2018	Common Sense ReasoningDeep Reinforcement Learning	CodeCode Available	5
Myopic Bayesian Design of Experiments via Posterior Sampling and Probabilistic Programming	May 25, 2018	Bayesian InferenceMulti-Armed Bandits	CodeCode Available	5
Towards the Use of Deep Reinforcement Learning with Global Policy For Query-based Extractive Summarisation	Nov 10, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Monte Carlo Q-learning for General Game Playing	Feb 16, 2018	Board GamesQ-Learning	CodeCode Available	5
Robust Reinforcement Learning Under Minimax Regret for Green Security	Jun 15, 2021	Decision Makingreinforcement-learning	CodeCode Available	5
Robust Reinforcement Learning under model misspecification	Mar 29, 2021	Adversarial Attackmodel	CodeCode Available	5
Robust Reinforcement Learning via Adversarial training with Langevin Dynamics	Feb 14, 2020	MuJoCoreinforcement-learning	CodeCode Available	5
Regret Minimization Experience Replay in Off-Policy Reinforcement Learning	May 15, 2021	MuJoCoreinforcement-learning	CodeCode Available	5
Regret Minimization for Partially Observable Deep Reinforcement Learning	Oct 31, 2017	counterfactualDeep Reinforcement Learning	CodeCode Available	5
Robust Reinforcement Learning with Dynamic Distortion Risk Measures	Sep 16, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	5
Robust Representation Learning by Clustering with Bisimulation Metrics for Visual Reinforcement Learning with Distractions	Feb 12, 2023	ClusteringReinforcement Learning (RL)	CodeCode Available	5
Toybox: A Suite of Environments for Experimental Evaluation of Deep Reinforcement Learning	May 7, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
ToyBox: Better Atari Environments for Testing Reinforcement Learning Agents	Dec 6, 2018	Atari Gamesreinforcement-learning	CodeCode Available	5
Regret Minimization for Reinforcement Learning with Vectorial Feedback and Complex Objectives	Dec 1, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	5
Integrating Distributed Architectures in Highly Modular RL Libraries	Jul 6, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	5
Unsupervised Attention Mechanism across Neural Network Layers	Feb 27, 2019	Few-Shot LearningImage Classification	CodeCode Available	5
Regularization and Variance-Weighted Regression Achieves Minimax Optimality in Linear MDPs: Theory and Practice	May 22, 2023	regressionReinforcement Learning (RL)	CodeCode Available	5
Tracking Object Positions in Reinforcement Learning: A Metric for Keypoint Detection (extended version)	Dec 1, 2023	Keypoint DetectionReinforcement Learning (RL)	CodeCode Available	5
Regularization Matters in Policy Optimization	Oct 21, 2019	continuous-controlContinuous Control	CodeCode Available	5

Show:10 25 50

← PrevPage 169 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified