Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8451–8500 of 15113 papers

Title	Date	Tasks	Status
Optimizing a domestic battery and solar photovoltaic system with deep reinforcement learning	Sep 10, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Multi-agent deep reinforcement learning (MADRL) meets multi-user MIMO systems	Sep 10, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Projected State-action Balancing Weights for Offline Reinforcement Learning	Sep 10, 2021	Causal Inferencereinforcement-learning	—Unverified
User Tampering in Reinforcement Learning Recommender Systems	Sep 9, 2021	Q-LearningRecommendation Systems	—Unverified
OPIRL: Sample Efficient Off-Policy Inverse Reinforcement Learning via Distribution Matching	Sep 9, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Self-supervised Reinforcement Learning with Independently Controllable Subgoals	Sep 9, 2021	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for Equal Risk Pricing and Hedging under Dynamic Expectile Risk Measures	Sep 9, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Incentivizing an Unknown Crowd	Sep 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Survey of Deep Reinforcement Learning in Recommender Systems: A Systematic Review and Future Directions	Sep 8, 2021	Deep Reinforcement LearningRecommendation Systems	—Unverified
A Bayesian Learning Algorithm for Unknown Zero-sum Stochastic Games with an Arbitrary Opponent	Sep 8, 2021	Reinforcement Learning (RL)	—Unverified
Convergence of Batch Asynchronous Stochastic Approximation With Applications to Reinforcement Learning	Sep 8, 2021	Q-Learningreinforcement-learning	—Unverified
Integrated and Adaptive Guidance and Control for Endoatmospheric Missiles via Reinforcement Learning	Sep 8, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified
A Deep Reinforcement Learning Approach for Online Parcel Assignment	Sep 8, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Membership Inference Attacks Against Temporally Correlated Data in Deep Reinforcement Learning	Sep 8, 2021	Adversarial Attackcontinuous-control	—Unverified
Safety-Critical Learning of Robot Control with Temporal Logic Specifications	Sep 7, 2021	Gaussian ProcessesReinforcement Learning (RL)	—Unverified
Robust Predictable Control	Sep 7, 2021	Computational EfficiencyDecision Making	—Unverified
On the impact of MDP design for Reinforcement Learning agents in Resource Management	Sep 7, 2021	Managementreinforcement-learning	—Unverified
CyGIL: A Cyber Gym for Training Autonomous Agents over Emulated Network Systems	Sep 7, 2021	Game DesignReinforcement Learning (RL)	—Unverified
Hindsight Reward Tweaking via Conditional Deep Reinforcement Learning	Sep 6, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
Delving into Macro Placement with Reinforcement Learning	Sep 6, 2021	reinforcement-learningReinforcement Learning	—Unverified
Enhancing Visual Dialog Questioner with Entity-based Strategy Learning and Augmented Guesser	Sep 6, 2021	DiversityReinforcement Learning (RL)	CodeCode Available
Guiding Global Placement With Reinforcement Learning	Sep 6, 2021	GPUreinforcement-learning	—Unverified
Deep SIMBAD: Active Landmark-based Self-localization Using Ranking -based Scene Descriptor	Sep 6, 2021	Q-LearningReinforcement Learning (RL)	—Unverified
Method for making multi-attribute decisions in wargames by combining intuitionistic fuzzy numbers with reinforcement learning	Sep 6, 2021	AttributeDecision Making	—Unverified
Temporal Shift Reinforcement Learning	Sep 5, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available
Recommendation Fairness: From Static to Dynamic	Sep 5, 2021	FairnessRecommendation Systems	—Unverified
On the Complexity of Computing Markov Perfect Equilibrium in General-Sum Stochastic Games	Sep 4, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Eden: A Unified Environment Framework for Booming Reinforcement Learning Algorithms	Sep 4, 2021	Allreinforcement-learning	—Unverified
Provably Safe Model-Based Meta Reinforcement Learning: An Abstraction-Based Approach	Sep 3, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified
Multi-agent Natural Actor-critic Reinforcement Learning Algorithms	Sep 3, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Unsupervised multi-latent space reinforcement learning framework for video summarization in ultrasound imaging	Sep 3, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Self-timed Reinforcement Learning using Tsetlin Machine	Sep 2, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Battery Energy Storage Dispatch augmented with Model-based Optimizer	Sep 2, 2021	Deep Reinforcement LearningImitation Learning	—Unverified
Multi-Agent Inverse Reinforcement Learning: Suboptimal Demonstrations and Alternative Solution Concepts	Sep 2, 2021	Decision MakingDescriptive	—Unverified
An Oracle and Observations for the OpenAI Gym / ALE Freeway Environment	Sep 2, 2021	OpenAI Gymreinforcement-learning	—Unverified
Boosting Search Engines with Interactive Agents	Sep 1, 2021	Information RetrievalReading Comprehension	—Unverified
Catastrophic Interference in Reinforcement Learning: A Solution Based on Context Division and Knowledge Distillation	Sep 1, 2021	Deep Reinforcement LearningGeneral Reinforcement Learning	CodeCode Available
A Survey of Exploration Methods in Reinforcement Learning	Sep 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Variational Quantum Reinforcement Learning via Evolutionary Optimization	Sep 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
OptAGAN: Entropy-based finetuning on text VAE-GAN	Sep 1, 2021	DecoderDiversity	CodeCode Available
Incorporating Deception into CyberBattleSim for Autonomous Defense	Aug 31, 2021	CyberBattleSimreinforcement-learning	—Unverified
Informing Autonomous Deception Systems with Cyber Expert Performance Data	Aug 31, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Investigating Vulnerabilities of Deep Neural Policies	Aug 30, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive perturbation adversarial training: based on reinforcement learning	Aug 30, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learning Meta Representations for Agents in Multi-Agent Reinforcement Learning	Aug 30, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Integrated Decision and Control at Multi-Lane Intersections with Mixed Traffic Flow	Aug 30, 2021	Autonomous DrivingModel Predictive Control	—Unverified
Identifying optimal cycles in quantum thermal machines with reinforcement-learning	Aug 30, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
A Policy Efficient Reduction Approach to Convex Constrained Deep Reinforcement Learning	Aug 29, 2021	Deep Reinforcement LearningGeneral Reinforcement Learning	—Unverified
Reinforcement Learning Based Sparse Black-box Adversarial Attack on Video Recognition Models	Aug 29, 2021	Adversarial Attackreinforcement-learning	—Unverified
Influence-Based Reinforcement Learning for Intrinsically-Motivated Agents	Aug 28, 2021	counterfactualMulti-agent Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 170 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified