Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1225 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
B-Pref: Benchmarking Preference-Based Reinforcement Learning	Nov 4, 2021	Benchmarkingreinforcement-learning	CodeCode Available	1	5
Federated Reinforcement Learning with Environment Heterogeneity	Apr 6, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Game-Theoretic Multiagent Reinforcement Learning	Nov 1, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
AutoPhase: Compiler Phase-Ordering for High Level Synthesis with Deep Reinforcement Learning	Jan 15, 2019	Deep Reinforcement LearningHigh-Level Synthesis	CodeCode Available	1	5
End-to-End Affordance Learning for Robotic Manipulation	Sep 26, 2022	Reinforcement Learning (RL)	CodeCode Available	1	5
ENERO: Efficient Real-Time WAN Routing Optimization with Deep Reinforcement Learning	Sep 22, 2021	Deep Reinforcement LearningGraph Neural Network	CodeCode Available	1	5
Autonomous Exploration Under Uncertainty via Deep Reinforcement Learning on Graphs	Jul 24, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1	5
Emergent collective intelligence from massive-agent cooperation and competition	Jan 4, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Bridging the Gap Between f-GANs and Wasserstein GANs	Jan 1, 2020	Density Ratio EstimationImage Generation	CodeCode Available	1	5
Bridging State and History Representations: Understanding Self-Predictive RL	Jan 17, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1	5
Accelerated Sim-to-Real Deep Reinforcement Learning: Learning Collision Avoidance from Human Player	Feb 21, 2021	Collision AvoidanceDeep Reinforcement Learning	CodeCode Available	1	5
Bayesian Soft Actor-Critic: A Directed Acyclic Strategy Graph Based Deep Reinforcement Learning	Aug 11, 2022	continuous-controlContinuous Control	CodeCode Available	1	5
Emergent Real-World Robotic Skills via Unsupervised Off-Policy Reinforcement Learning	Apr 27, 2020	Model Predictive Controlreinforcement-learning	CodeCode Available	1	5
Building a Foundation for Data-Driven, Interpretable, and Robust Policy Design using the AI Economist	Aug 6, 2021	Reinforcement Learning (RL)	CodeCode Available	1	5
Automating DBSCAN via Deep Reinforcement Learning	Aug 9, 2022	ClusteringComputational Efficiency	CodeCode Available	1	5
CaiRL: A High-Performance Reinforcement Learning Environment Toolkit	Oct 3, 2022	OpenAI Gymreinforcement-learning	CodeCode Available	1	5
Emergent behavior and neural dynamics in artificial agents tracking turbulent plumes	Sep 25, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
AnyBipe: An End-to-End Framework for Training and Deploying Bipedal Robots Guided by Large Language Models	Sep 13, 2024	Reinforcement Learning (RL)	CodeCode Available	1	5
Can Increasing Input Dimensionality Improve Deep Reinforcement Learning?	Mar 3, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1	5
Can Question Rewriting Help Conversational Question Answering?	Apr 13, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	1	5
Can Learned Optimization Make Reinforcement Learning Less Difficult?	Jul 9, 2024	Decision MakingMeta-Learning	CodeCode Available	1	5
Can Q-Learning with Graph Networks Learn a Generalizable Branching Heuristic for a SAT Solver?	Dec 1, 2020	Feature EngineeringQ-Learning	CodeCode Available	1	5
Avalanche RL: a Continual Reinforcement Learning Library	Feb 28, 2022	Continual LearningOpenAI Gym	CodeCode Available	1	5
Automatic Truss Design with Reinforcement Learning	Jun 27, 2023	Combinatorial OptimizationLayout Design	CodeCode Available	1	5
Barrier Certified Safety Learning Control: When Sum-of-Square Programming Meets Reinforcement Learning	Jun 16, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 49 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified