Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8476–8500 of 15113 papers

Title	Date	Tasks	Status
Recommendation Fairness: From Static to Dynamic	Sep 5, 2021	FairnessRecommendation Systems	—Unverified
On the Complexity of Computing Markov Perfect Equilibrium in General-Sum Stochastic Games	Sep 4, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Eden: A Unified Environment Framework for Booming Reinforcement Learning Algorithms	Sep 4, 2021	Allreinforcement-learning	—Unverified
Provably Safe Model-Based Meta Reinforcement Learning: An Abstraction-Based Approach	Sep 3, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified
Multi-agent Natural Actor-critic Reinforcement Learning Algorithms	Sep 3, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Unsupervised multi-latent space reinforcement learning framework for video summarization in ultrasound imaging	Sep 3, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Self-timed Reinforcement Learning using Tsetlin Machine	Sep 2, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Battery Energy Storage Dispatch augmented with Model-based Optimizer	Sep 2, 2021	Deep Reinforcement LearningImitation Learning	—Unverified
Multi-Agent Inverse Reinforcement Learning: Suboptimal Demonstrations and Alternative Solution Concepts	Sep 2, 2021	Decision MakingDescriptive	—Unverified
An Oracle and Observations for the OpenAI Gym / ALE Freeway Environment	Sep 2, 2021	OpenAI Gymreinforcement-learning	—Unverified
Boosting Search Engines with Interactive Agents	Sep 1, 2021	Information RetrievalReading Comprehension	—Unverified
Catastrophic Interference in Reinforcement Learning: A Solution Based on Context Division and Knowledge Distillation	Sep 1, 2021	Deep Reinforcement LearningGeneral Reinforcement Learning	CodeCode Available
A Survey of Exploration Methods in Reinforcement Learning	Sep 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Variational Quantum Reinforcement Learning via Evolutionary Optimization	Sep 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
OptAGAN: Entropy-based finetuning on text VAE-GAN	Sep 1, 2021	DecoderDiversity	CodeCode Available
Incorporating Deception into CyberBattleSim for Autonomous Defense	Aug 31, 2021	CyberBattleSimreinforcement-learning	—Unverified
Informing Autonomous Deception Systems with Cyber Expert Performance Data	Aug 31, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Investigating Vulnerabilities of Deep Neural Policies	Aug 30, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive perturbation adversarial training: based on reinforcement learning	Aug 30, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learning Meta Representations for Agents in Multi-Agent Reinforcement Learning	Aug 30, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Integrated Decision and Control at Multi-Lane Intersections with Mixed Traffic Flow	Aug 30, 2021	Autonomous DrivingModel Predictive Control	—Unverified
Identifying optimal cycles in quantum thermal machines with reinforcement-learning	Aug 30, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
A Policy Efficient Reduction Approach to Convex Constrained Deep Reinforcement Learning	Aug 29, 2021	Deep Reinforcement LearningGeneral Reinforcement Learning	—Unverified
Reinforcement Learning Based Sparse Black-box Adversarial Attack on Video Recognition Models	Aug 29, 2021	Adversarial Attackreinforcement-learning	—Unverified
Influence-Based Reinforcement Learning for Intrinsically-Motivated Agents	Aug 28, 2021	counterfactualMulti-agent Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 340 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified