Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14901–14950 of 15113 papers

Title	Date	Tasks	Status
Grounding Language for Transfer in Deep Reinforcement Learning	Aug 1, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Combining imitation and deep reinforcement learning to accomplish human-level performance on a virtual foraging task	Mar 11, 2022	Deep Reinforcement LearningImitation Learning	CodeCode Available
Learning by Competition of Self-Interested Reinforcement Learning Agents	Oct 19, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Bayesian Optimization for Iterative Learning	Sep 20, 2019	Bayesian OptimizationDeep Reinforcement Learning	CodeCode Available
Learning from Learners: Adapting Reinforcement Learning Agents to be Competitive in a Card Game	Apr 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Bayesian Nonparametrics for Offline Skill Discovery	Feb 9, 2022	Imitation Learningreinforcement-learning	CodeCode Available
Look Before You Leap: Bridging Model-Free and Model-Based Reinforcement Learning for Planned-Ahead Vision-and-Language Navigation	Mar 21, 2018	Deep Reinforcement Learningmodel	CodeCode Available
Learning from Multiple Independent Advisors in Multi-agent Reinforcement Learning	Jan 26, 2023	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available
Group-driven Reinforcement Learning for Personalized mHealth Intervention	Aug 14, 2017	ClusteringDecision Making	CodeCode Available
Evolutionary learning of interpretable decision trees	Dec 14, 2020	Evolutionary AlgorithmsOpenAI Gym	CodeCode Available
Group Equivariant Deep Reinforcement Learning	Jul 1, 2020	Deep Reinforcement LearningInductive Bias	CodeCode Available
Controlling epidemics through optimal allocation of test kits and vaccine doses across networks	Jul 29, 2021	Managementreinforcement-learning	CodeCode Available
Learning the Reward Function for a Misspecified Model	Jan 29, 2018	modelModel-based Reinforcement Learning	CodeCode Available
Growing Action Spaces	Jun 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Controllable Neural Story Plot Generation via Reward Shaping	Sep 27, 2018	Language ModelingLanguage Modelling	CodeCode Available
Incentivizing Exploration In Reinforcement Learning With Deep Predictive Models	Jul 3, 2015	Atari Gamesreinforcement-learning	CodeCode Available
A reinforcement learning approach to rare trajectory sampling	May 26, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Incentivizing Reasoning from Weak Supervision	May 26, 2025	reinforcement-learningReinforcement Learning	CodeCode Available
Learning to Run challenge solutions: Adapting reinforcement learning methods for neuromusculoskeletal environments	Apr 2, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Bayesian Inverse Reinforcement Learning for Collective Animal Movement	Sep 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
gTLO: A Generalized and Non-linear Multi-Objective Deep Reinforcement Learning Approach	Apr 11, 2022	Deep Reinforcement LearningDeep-Sea Treasure, Image version	CodeCode Available
A Reinforcement Learning Approach to Domain-Knowledge Inclusion Using Grammar Guided Symbolic Regression	Feb 9, 2022	regressionreinforcement-learning	CodeCode Available
Evolution-Guided Policy Gradient in Reinforcement Learning	May 21, 2018	continuous-controlContinuous Control	CodeCode Available
A Reinforcement Learning Approach to Interactive-Predictive Neural Machine Translation	May 3, 2018	Machine Translationreinforcement-learning	CodeCode Available
Adaptive Discretization for Model-Based Reinforcement Learning	Jul 1, 2020	modelModel-based Reinforcement Learning	CodeCode Available
Control Frequency Adaptation via Action Persistence in Batch Reinforcement Learning	Feb 17, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
A Reinforcement Learning Approach for Performance-aware Reduction in Power Consumption of Data Center Compute Nodes	Aug 15, 2023	ManagementReinforcement Learning (RL)	CodeCode Available
Evolved Policy Gradients	Feb 13, 2018	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Contrastive Explanations for Reinforcement Learning via Embedded Self Predictions	Oct 11, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Using a Logarithmic Mapping to Enable Lower Discount Factors in Reinforcement Learning	Jun 3, 2019	General Reinforcement Learningreinforcement-learning	CodeCode Available
Learning from Sparse Offline Datasets via Conservative Density Estimation	Jan 16, 2024	D4RLDensity Estimation	CodeCode Available
Guide Actor-Critic for Continuous Control	May 22, 2017	continuous-controlContinuous Control	CodeCode Available
Evolving Inborn Knowledge For Fast Adaptation in Dynamic POMDP Problems	Apr 27, 2020	Meta Reinforcement LearningMinecraft	CodeCode Available
Jointly Learning to Construct and Control Agents using Deep Reinforcement Learning	Jan 4, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Jointly Pre-training with Supervised, Autoencoder, and Value Losses for Deep Reinforcement Learning	Apr 3, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Contrastive Behavioral Similarity Embeddings for Generalization in Reinforcement Learning	Jan 13, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Guided Cooperation in Hierarchical Reinforcement Learning via Model-based Rollout	Sep 24, 2023	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available
Contrasting Exploration in Parameter and Action Space: A Zeroth-Order Optimization Perspective	Jan 31, 2019	continuous-controlContinuous Control	CodeCode Available
Leave no Trace: Learning to Reset for Safe and Autonomous Reinforcement Learning	Nov 18, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Guided Deep Reinforcement Learning for Swarm Systems	Sep 18, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Guided Dialog Policy Learning: Reward Estimation for Multi-Domain Task-Oriented Dialog	Aug 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Continuous Value Iteration (CVI) Reinforcement Learning and Imaginary Experience Replay (IER) for learning multi-goal, continuous action and state space controllers	Aug 27, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Guided Dialog Policy Learning without Adversarial Learning in the Loop	Apr 7, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Continuous Transition: Improving Sample Efficiency for Continuous Control Problems via MixUp	Nov 30, 2020	continuous-controlContinuous Control	CodeCode Available
EX2: Exploration with Exemplar Models for Deep Reinforcement Learning	Mar 3, 2017	Deep Reinforcement LearningDensity Estimation	CodeCode Available
Exact Asymptotics for Linear Quadratic Adaptive Control	Nov 2, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Exact-K Recommendation via Maximal Clique Optimization	May 17, 2019	Combinatorial OptimizationDecoder	CodeCode Available
Guided Dialogue Policy Learning without Adversarial Learning in the Loop	Nov 1, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
LIFT: Reinforcement Learning in Computer Systems by Learning From Demonstrations	Aug 23, 2018	Deep Reinforcement LearningManagement	CodeCode Available
Examining Policy Entropy of Reinforcement Learning Agents for Personalization Tasks	Nov 21, 2022	Q-Learningreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 299 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified