Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7526–7550 of 15113 papers

Title	Date	Tasks	Status	Hype
Method for making multi-attribute decisions in wargames by combining intuitionistic fuzzy numbers with reinforcement learning	Sep 6, 2021	AttributeDecision Making	—Unverified	0
Recommendation Fairness: From Static to Dynamic	Sep 5, 2021	FairnessRecommendation Systems	—Unverified	0
Temporal Shift Reinforcement Learning	Sep 5, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
On the Complexity of Computing Markov Perfect Equilibrium in General-Sum Stochastic Games	Sep 4, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Eden: A Unified Environment Framework for Booming Reinforcement Learning Algorithms	Sep 4, 2021	Allreinforcement-learning	—Unverified	0
Provably Safe Model-Based Meta Reinforcement Learning: An Abstraction-Based Approach	Sep 3, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Multi-agent Natural Actor-critic Reinforcement Learning Algorithms	Sep 3, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Unsupervised multi-latent space reinforcement learning framework for video summarization in ultrasound imaging	Sep 3, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Reinforcement Learning for Battery Energy Storage Dispatch augmented with Model-based Optimizer	Sep 2, 2021	Deep Reinforcement LearningImitation Learning	—Unverified	0
Self-timed Reinforcement Learning using Tsetlin Machine	Sep 2, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Multi-Agent Inverse Reinforcement Learning: Suboptimal Demonstrations and Alternative Solution Concepts	Sep 2, 2021	Decision MakingDescriptive	—Unverified	0
A Comparative Study of Algorithms for Intelligent Traffic Signal Control	Sep 2, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	2
An Oracle and Observations for the OpenAI Gym / ALE Freeway Environment	Sep 2, 2021	OpenAI Gymreinforcement-learning	—Unverified	0
A Survey of Exploration Methods in Reinforcement Learning	Sep 1, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Boosting Search Engines with Interactive Agents	Sep 1, 2021	Information RetrievalReading Comprehension	—Unverified	0
Catastrophic Interference in Reinforcement Learning: A Solution Based on Context Division and Knowledge Distillation	Sep 1, 2021	Deep Reinforcement LearningGeneral Reinforcement Learning	CodeCode Available	0
OptAGAN: Entropy-based finetuning on text VAE-GAN	Sep 1, 2021	DecoderDiversity	CodeCode Available	0
Variational Quantum Reinforcement Learning via Evolutionary Optimization	Sep 1, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Informing Autonomous Deception Systems with Cyber Expert Performance Data	Aug 31, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Incorporating Deception into CyberBattleSim for Autonomous Defense	Aug 31, 2021	CyberBattleSimreinforcement-learning	—Unverified	0
WarpDrive: Extremely Fast End-to-End Deep Multi-Agent Reinforcement Learning on a GPU	Aug 31, 2021	CPUDecision Making	CodeCode Available	1
Hallucinated but Factual! Inspecting the Factuality of Hallucinations in Abstractive Summarization	Aug 30, 2021	Abstractive Text SummarizationReinforcement Learning (RL)	CodeCode Available	1
Deep Reinforcement Learning at the Edge of the Statistical Precipice	Aug 30, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Investigating Vulnerabilities of Deep Neural Policies	Aug 30, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Adaptive perturbation adversarial training: based on reinforcement learning	Aug 30, 2021	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 302 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified