Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2276–2300 of 15113 papers

Title	Date	Tasks	Status	Score
Learning How to Active Learn by Dreaming	Jul 1, 2019	Active Learningnamed-entity-recognition	CodeCode Available	5
Learning How to Actively Learn: A Deep Imitation Learning Approach	Jul 1, 2018	Active LearningGeneral Classification	CodeCode Available	5
Learning Natural Language Generation with Truncated Reinforcement Learning	Jul 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	5
Learning Heuristics for Quantified Boolean Formulas through Deep Reinforcement Learning	Jul 20, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	5
Learning Goal-Oriented Visual Dialog via Tempered Policy Gradient	Jul 2, 2018	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available	5
Adaptive Traffic Control with Deep Reinforcement Learning:Towards State-of-the-art and Beyond	Jul 21, 2020	Decision Makingreinforcement-learning	CodeCode Available	5
Learning Graph-Enhanced Commander-Executor for Multi-Agent Navigation	Feb 8, 2023	Hierarchical Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	5
Learning Heuristics over Large Graphs via Deep Reinforcement Learning	Mar 8, 2019	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	5
Learning Generalizable Representations for Reinforcement Learning via Adaptive Meta-learner of Behavioral Similarities	Dec 26, 2022	Data Augmentationreinforcement-learning	CodeCode Available	5
Beating the World's Best at Super Smash Bros. with Deep Reinforcement Learning	Feb 21, 2017	Atari GamesBoard Games	CodeCode Available	5
Beating Atari with Natural Language Guided Reinforcement Learning	Apr 18, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available	5
Learning Goal Embeddings via Self-Play for Hierarchical Reinforcement Learning	Nov 22, 2018	Hierarchical Reinforcement LearningMuJoCo	CodeCode Available	5
Learning from Multiple Independent Advisors in Multi-agent Reinforcement Learning	Jan 26, 2023	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	5
Learning from Learners: Adapting Reinforcement Learning Agents to be Competitive in a Card Game	Apr 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	5
Learning from Sparse Offline Datasets via Conservative Density Estimation	Jan 16, 2024	D4RLDensity Estimation	CodeCode Available	5
Learning from Demonstration without Demonstrations	Jun 17, 2021	Reinforcement Learning (RL)	CodeCode Available	5
Combining imitation and deep reinforcement learning to accomplish human-level performance on a virtual foraging task	Mar 11, 2022	Deep Reinforcement LearningImitation Learning	CodeCode Available	5
Learning from Trajectories via Subgoal Discovery	Nov 3, 2019	Imitation LearningReinforcement Learning	CodeCode Available	5
Learning from Ambiguous Demonstrations with Self-Explanation Guided Reinforcement Learning	Oct 11, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	5
Learning Generalizable Device Placement Algorithms for Distributed Machine Learning	Dec 1, 2019	BIG-bench Machine LearningReinforcement Learning	CodeCode Available	5
Learning how to Active Learn: A Deep Reinforcement Learning Approach	Aug 8, 2017	Active LearningDeep Reinforcement Learning	CodeCode Available	5
Bayesian Robust Optimization for Imitation Learning	Jul 24, 2020	Imitation Learningreinforcement-learning	CodeCode Available	5
A Biologically Plausible Learning Rule for Deep Learning in the Brain	Nov 5, 2018	Deep Learningimage-classification	CodeCode Available	5
Learning data augmentation policies using augmented random search	Nov 12, 2018	Data Augmentationreinforcement-learning	CodeCode Available	5
Learning-Driven Exploration for Reinforcement Learning	Jun 17, 2019	Efficient ExplorationFPS Games	CodeCode Available	5

Show:10 25 50

← PrevPage 92 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified