Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7976–8000 of 15113 papers

Title	Date	Tasks	Status
DESTA: A Framework for Safe Reinforcement Learning with Markov Games of Intervention	Oct 27, 2021	OpenAI Gymreinforcement-learning	—Unverified
A Subgame Perfect Equilibrium Reinforcement Learning Approach to Time-inconsistent Problems	Oct 27, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
The ODE Method for Asymptotic Statistics in Stochastic Approximation and Reinforcement Learning	Oct 27, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Stabilising viscous extensional flows using Reinforcement Learning	Oct 27, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
APPTeK: Agent-Based Predicate Prediction in Temporal Knowledge Graphs	Oct 27, 2021	Knowledge GraphsPrediction	—Unverified
Model based Multi-agent Reinforcement Learning with Tensor Decompositions	Oct 27, 2021	Model-based Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Transfer learning with causal counterfactual reasoning in Decision Transformers	Oct 27, 2021	counterfactualCounterfactual Reasoning	—Unverified
Reinforcement Learning in Linear MDPs: Constant Regret and Representation Selection	Oct 27, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in Factored Action Spaces using Tensor Decompositions	Oct 27, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Towards Hyperparameter-free Policy Selection for Offline Reinforcement Learning	Oct 26, 2021	Off-policy evaluationOpen-Ended Question Answering	CodeCode Available
The Difficulty of Passive Learning in Deep Reinforcement Learning	Oct 26, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Multi-Agent Advisor Q-Learning	Oct 26, 2021	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available
Fragment-based Sequential Translation for Molecular Optimization	Oct 26, 2021	Drug DiscoveryReinforcement Learning (RL)	—Unverified
Average-Reward Learning and Planning with Options	Oct 26, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Distributional Reinforcement Learning for Multi-Dimensional Reward Functions	Oct 26, 2021	Distributional Reinforcement Learningreinforcement-learning	CodeCode Available
Accelerating Distributed Deep Reinforcement Learning by In-Network Experience Sampling	Oct 26, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
EnTRPO: Trust Region Policy Optimization Method with Entropy Regularization	Oct 26, 2021	reinforcement-learningReinforcement Learning	—Unverified
Neural PPO-Clip Attains Global Optimality: A Hinge Loss Perspective	Oct 26, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Automating Control of Overestimation Bias for Reinforcement Learning	Oct 26, 2021	Continuous ControlQ-Learning	—Unverified
Learning Robust Controllers Via Probabilistic Model-Based Policy Search	Oct 26, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Applications of Multi-Agent Reinforcement Learning in Future Internet: A Comprehensive Survey	Oct 26, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Distributed Multi-Agent Deep Reinforcement Learning Framework for Whole-building HVAC Control	Oct 26, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning What to Memorize: Using Intrinsic Motivation to Form Useful Memory in Partially Observable Reinforcement Learning	Oct 25, 2021	FormPartially Observable Reinforcement Learning	—Unverified
Can Q-Learning be Improved with Advice?	Oct 25, 2021	Q-Learningreinforcement-learning	—Unverified
Common Information based Approximate State Representations in Multi-Agent Reinforcement Learning	Oct 25, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 320 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified