Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7501–7525 of 15113 papers

Title	Date	Tasks	Status	Hype
Data Generation Method for Learning a Low-dimensional Safe Region in Safe Reinforcement Learning	Sep 10, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Equal Risk Pricing and Hedging under Dynamic Expectile Risk Measures	Sep 9, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Incentivizing an Unknown Crowd	Sep 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
TimeTraveler: Reinforcement Learning for Temporal Knowledge Graph Forecasting	Sep 9, 2021	Link Predictionreinforcement-learning	CodeCode Available	1
OPIRL: Sample Efficient Off-Policy Inverse Reinforcement Learning via Distribution Matching	Sep 9, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
User Tampering in Reinforcement Learning Recommender Systems	Sep 9, 2021	Q-LearningRecommendation Systems	—Unverified	0
Self-supervised Reinforcement Learning with Independently Controllable Subgoals	Sep 9, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
PowerGym: A Reinforcement Learning Environment for Volt-Var Control in Power Distribution Systems	Sep 8, 2021	OpenAI Gymreinforcement-learning	CodeCode Available	1
Membership Inference Attacks Against Temporally Correlated Data in Deep Reinforcement Learning	Sep 8, 2021	Adversarial Attackcontinuous-control	—Unverified	0
A Deep Reinforcement Learning Approach for Online Parcel Assignment	Sep 8, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
A Bayesian Learning Algorithm for Unknown Zero-sum Stochastic Games with an Arbitrary Opponent	Sep 8, 2021	Reinforcement Learning (RL)	—Unverified	0
A Survey of Deep Reinforcement Learning in Recommender Systems: A Systematic Review and Future Directions	Sep 8, 2021	Deep Reinforcement LearningRecommendation Systems	—Unverified	0
Convergence of Batch Asynchronous Stochastic Approximation With Applications to Reinforcement Learning	Sep 8, 2021	Q-Learningreinforcement-learning	—Unverified	0
Integrated and Adaptive Guidance and Control for Endoatmospheric Missiles via Reinforcement Learning	Sep 8, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified	0
CyGIL: A Cyber Gym for Training Autonomous Agents over Emulated Network Systems	Sep 7, 2021	Game DesignReinforcement Learning (RL)	—Unverified	0
Robust Predictable Control	Sep 7, 2021	Computational EfficiencyDecision Making	—Unverified	0
Safety-Critical Learning of Robot Control with Temporal Logic Specifications	Sep 7, 2021	Gaussian ProcessesReinforcement Learning (RL)	—Unverified	0
The Sensory Neuron as a Transformer: Permutation-Invariant Neural Networks for Reinforcement Learning	Sep 7, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	2
Optimizing Quantum Variational Circuits with Deep Reinforcement Learning	Sep 7, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	CodeCode Available	1
On the impact of MDP design for Reinforcement Learning agents in Resource Management	Sep 7, 2021	Managementreinforcement-learning	—Unverified	0
Deep SIMBAD: Active Landmark-based Self-localization Using Ranking -based Scene Descriptor	Sep 6, 2021	Q-LearningReinforcement Learning (RL)	—Unverified	0
Delving into Macro Placement with Reinforcement Learning	Sep 6, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Enhancing Visual Dialog Questioner with Entity-based Strategy Learning and Augmented Guesser	Sep 6, 2021	DiversityReinforcement Learning (RL)	CodeCode Available	0
Hindsight Reward Tweaking via Conditional Deep Reinforcement Learning	Sep 6, 2021	Deep Reinforcement LearningMuJoCo	—Unverified	0
Guiding Global Placement With Reinforcement Learning	Sep 6, 2021	GPUreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 301 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified