Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2301–2325 of 15113 papers

Title	Date	Tasks	Status	Score
Learning Goal-Oriented Visual Dialog via Tempered Policy Gradient	Jul 2, 2018	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available	5
Analysis and Control of a Planar Quadrotor	Jun 29, 2021	Positionreinforcement-learning	CodeCode Available	5
Learning Graph-Enhanced Commander-Executor for Multi-Agent Navigation	Feb 8, 2023	Hierarchical Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	5
Adaptive teachers for amortized samplers	Oct 2, 2024	Decision MakingEfficient Exploration	CodeCode Available	5
Learning Goal Embeddings via Self-Play for Hierarchical Reinforcement Learning	Nov 22, 2018	Hierarchical Reinforcement LearningMuJoCo	CodeCode Available	5
Learning How to Active Learn by Dreaming	Jul 1, 2019	Active Learningnamed-entity-recognition	CodeCode Available	5
Bayesian Optimization with Robust Bayesian Neural Networks	Dec 1, 2016	Bayesian OptimizationDeep Reinforcement Learning	CodeCode Available	5
Bayesian Optimization for Iterative Learning	Sep 20, 2019	Bayesian OptimizationDeep Reinforcement Learning	CodeCode Available	5
Learning from Trajectories via Subgoal Discovery	Nov 3, 2019	Imitation LearningReinforcement Learning	CodeCode Available	5
Bayesian Nonparametrics for Offline Skill Discovery	Feb 9, 2022	Imitation Learningreinforcement-learning	CodeCode Available	5
Adaptive Symmetric Reward Noising for Reinforcement Learning	May 24, 2019	Autonomous DrivingQ-Learning	CodeCode Available	5
Learning from Sparse Offline Datasets via Conservative Density Estimation	Jan 16, 2024	D4RLDensity Estimation	CodeCode Available	5
Learning Generalizable Device Placement Algorithms for Distributed Machine Learning	Dec 1, 2019	BIG-bench Machine LearningReinforcement Learning	CodeCode Available	5
MAP Propagation Algorithm: Faster Learning with a Team of Reinforcement Learning Agents	Oct 15, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Bayesian Inverse Reinforcement Learning for Collective Animal Movement	Sep 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	5
Learning from Learners: Adapting Reinforcement Learning Agents to be Competitive in a Card Game	Apr 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	5
Bayesian Inference with Anchored Ensembles of Neural Networks, and Application to Exploration in Reinforcement Learning	May 29, 2018	Bayesian Inferencereinforcement-learning	CodeCode Available	5
A Comparison of Reward Functions in Q-Learning Applied to a Cart Position Problem	May 25, 2021	PositionQ-Learning	CodeCode Available	5
Learning from Multiple Independent Advisors in Multi-agent Reinforcement Learning	Jan 26, 2023	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	5
Learning Generalizable Representations for Reinforcement Learning via Adaptive Meta-learner of Behavioral Similarities	Dec 26, 2022	Data Augmentationreinforcement-learning	CodeCode Available	5
Learning How to Actively Learn: A Deep Imitation Learning Approach	Jul 1, 2018	Active LearningGeneral Classification	CodeCode Available	5
Learning Fair Policies in Multiobjective (Deep) Reinforcement Learning with Average and Discounted Rewards	Aug 18, 2020	Deep Reinforcement LearningFairness	CodeCode Available	5
Learning from Ambiguous Demonstrations with Self-Explanation Guided Reinforcement Learning	Oct 11, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
A Comparison of Reinforcement Learning Frameworks for Software Testing Tasks	Aug 25, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Bayesian Design Principles for Offline-to-Online Reinforcement Learning	May 31, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	5

Show:10 25 50

← PrevPage 93 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified