Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7501–7550 of 15113 papers

Title	Date	Tasks	Status	Hype
Data Generation Method for Learning a Low-dimensional Safe Region in Safe Reinforcement Learning	Sep 10, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Equal Risk Pricing and Hedging under Dynamic Expectile Risk Measures	Sep 9, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Incentivizing an Unknown Crowd	Sep 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
TimeTraveler: Reinforcement Learning for Temporal Knowledge Graph Forecasting	Sep 9, 2021	Link Predictionreinforcement-learning	CodeCode Available	1
OPIRL: Sample Efficient Off-Policy Inverse Reinforcement Learning via Distribution Matching	Sep 9, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
User Tampering in Reinforcement Learning Recommender Systems	Sep 9, 2021	Q-LearningRecommendation Systems	—Unverified	0
Self-supervised Reinforcement Learning with Independently Controllable Subgoals	Sep 9, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
PowerGym: A Reinforcement Learning Environment for Volt-Var Control in Power Distribution Systems	Sep 8, 2021	OpenAI Gymreinforcement-learning	CodeCode Available	1
Membership Inference Attacks Against Temporally Correlated Data in Deep Reinforcement Learning	Sep 8, 2021	Adversarial Attackcontinuous-control	—Unverified	0
A Deep Reinforcement Learning Approach for Online Parcel Assignment	Sep 8, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
A Bayesian Learning Algorithm for Unknown Zero-sum Stochastic Games with an Arbitrary Opponent	Sep 8, 2021	Reinforcement Learning (RL)	—Unverified	0
A Survey of Deep Reinforcement Learning in Recommender Systems: A Systematic Review and Future Directions	Sep 8, 2021	Deep Reinforcement LearningRecommendation Systems	—Unverified	0
Convergence of Batch Asynchronous Stochastic Approximation With Applications to Reinforcement Learning	Sep 8, 2021	Q-Learningreinforcement-learning	—Unverified	0
Integrated and Adaptive Guidance and Control for Endoatmospheric Missiles via Reinforcement Learning	Sep 8, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified	0
CyGIL: A Cyber Gym for Training Autonomous Agents over Emulated Network Systems	Sep 7, 2021	Game DesignReinforcement Learning (RL)	—Unverified	0
Robust Predictable Control	Sep 7, 2021	Computational EfficiencyDecision Making	—Unverified	0
Safety-Critical Learning of Robot Control with Temporal Logic Specifications	Sep 7, 2021	Gaussian ProcessesReinforcement Learning (RL)	—Unverified	0
The Sensory Neuron as a Transformer: Permutation-Invariant Neural Networks for Reinforcement Learning	Sep 7, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	2
Optimizing Quantum Variational Circuits with Deep Reinforcement Learning	Sep 7, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	CodeCode Available	1
On the impact of MDP design for Reinforcement Learning agents in Resource Management	Sep 7, 2021	Managementreinforcement-learning	—Unverified	0
Deep SIMBAD: Active Landmark-based Self-localization Using Ranking -based Scene Descriptor	Sep 6, 2021	Q-LearningReinforcement Learning (RL)	—Unverified	0
Delving into Macro Placement with Reinforcement Learning	Sep 6, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Enhancing Visual Dialog Questioner with Entity-based Strategy Learning and Augmented Guesser	Sep 6, 2021	DiversityReinforcement Learning (RL)	CodeCode Available	0
Hindsight Reward Tweaking via Conditional Deep Reinforcement Learning	Sep 6, 2021	Deep Reinforcement LearningMuJoCo	—Unverified	0
Guiding Global Placement With Reinforcement Learning	Sep 6, 2021	GPUreinforcement-learning	—Unverified	0
Method for making multi-attribute decisions in wargames by combining intuitionistic fuzzy numbers with reinforcement learning	Sep 6, 2021	AttributeDecision Making	—Unverified	0
Recommendation Fairness: From Static to Dynamic	Sep 5, 2021	FairnessRecommendation Systems	—Unverified	0
Temporal Shift Reinforcement Learning	Sep 5, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
On the Complexity of Computing Markov Perfect Equilibrium in General-Sum Stochastic Games	Sep 4, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Eden: A Unified Environment Framework for Booming Reinforcement Learning Algorithms	Sep 4, 2021	Allreinforcement-learning	—Unverified	0
Provably Safe Model-Based Meta Reinforcement Learning: An Abstraction-Based Approach	Sep 3, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Multi-agent Natural Actor-critic Reinforcement Learning Algorithms	Sep 3, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Unsupervised multi-latent space reinforcement learning framework for video summarization in ultrasound imaging	Sep 3, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Reinforcement Learning for Battery Energy Storage Dispatch augmented with Model-based Optimizer	Sep 2, 2021	Deep Reinforcement LearningImitation Learning	—Unverified	0
Self-timed Reinforcement Learning using Tsetlin Machine	Sep 2, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Multi-Agent Inverse Reinforcement Learning: Suboptimal Demonstrations and Alternative Solution Concepts	Sep 2, 2021	Decision MakingDescriptive	—Unverified	0
A Comparative Study of Algorithms for Intelligent Traffic Signal Control	Sep 2, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	2
An Oracle and Observations for the OpenAI Gym / ALE Freeway Environment	Sep 2, 2021	OpenAI Gymreinforcement-learning	—Unverified	0
A Survey of Exploration Methods in Reinforcement Learning	Sep 1, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Boosting Search Engines with Interactive Agents	Sep 1, 2021	Information RetrievalReading Comprehension	—Unverified	0
Catastrophic Interference in Reinforcement Learning: A Solution Based on Context Division and Knowledge Distillation	Sep 1, 2021	Deep Reinforcement LearningGeneral Reinforcement Learning	CodeCode Available	0
OptAGAN: Entropy-based finetuning on text VAE-GAN	Sep 1, 2021	DecoderDiversity	CodeCode Available	0
Variational Quantum Reinforcement Learning via Evolutionary Optimization	Sep 1, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Informing Autonomous Deception Systems with Cyber Expert Performance Data	Aug 31, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Incorporating Deception into CyberBattleSim for Autonomous Defense	Aug 31, 2021	CyberBattleSimreinforcement-learning	—Unverified	0
WarpDrive: Extremely Fast End-to-End Deep Multi-Agent Reinforcement Learning on a GPU	Aug 31, 2021	CPUDecision Making	CodeCode Available	1
Hallucinated but Factual! Inspecting the Factuality of Hallucinations in Abstractive Summarization	Aug 30, 2021	Abstractive Text SummarizationReinforcement Learning (RL)	CodeCode Available	1
Deep Reinforcement Learning at the Edge of the Statistical Precipice	Aug 30, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Investigating Vulnerabilities of Deep Neural Policies	Aug 30, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Adaptive perturbation adversarial training: based on reinforcement learning	Aug 30, 2021	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 151 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified