Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1426–1450 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
ARLO: A Framework for Automated Reinforcement Learning	May 20, 2022	feature selectionMuJoCo	CodeCode Available	1	5
Learning Synthetic Environments and Reward Networks for Reinforcement Learning	Feb 6, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Learning Synthetic Environments for Reinforcement Learning with Evolution Strategies	Jan 24, 2021	Acrobotreinforcement-learning	CodeCode Available	1	5
Federated Ensemble-Directed Offline Reinforcement Learning	May 4, 2023	continuous-controlContinuous Control	CodeCode Available	1	5
Decoupling Strategy and Generation in Negotiation Dialogues	Aug 29, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Federated Reinforcement Learning with Environment Heterogeneity	Apr 6, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Backprop-Free Reinforcement Learning with Active Neural Generative Coding	Jul 10, 2021	Q-Learningreinforcement-learning	CodeCode Available	1	5
Learning to Act without Actions	Dec 17, 2023	Reinforcement Learning (RL)	CodeCode Available	1	5
Learning to Adapt in Dynamic, Real-World Environments Through Meta-Reinforcement Learning	Mar 30, 2018	continuous-controlContinuous Control	CodeCode Available	1	5
Feasible Actor-Critic: Constrained Reinforcement Learning for Ensuring Statewise Safety	May 22, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Deep Black-Box Reinforcement Learning with Movement Primitives	Oct 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Federated Deep Reinforcement Learning for the Distributed Control of NextG Wireless Networks	Dec 7, 2021	Autonomous VehiclesDeep Reinforcement Learning	CodeCode Available	1	5
Deep Deterministic Portfolio Optimization	Mar 13, 2020	Deep Reinforcement LearningPortfolio Optimization	CodeCode Available	1	5
Artist Agent: A Reinforcement Learning Approach to Automatic Stroke Generation in Oriental Ink Painting	Jun 18, 2012	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1	5
Deep Implicit Coordination Graphs for Multi-agent Reinforcement Learning	Jun 19, 2020	Graph Neural NetworkMulti-agent Reinforcement Learning	CodeCode Available	1	5
Deep Laplacian-based Options for Temporally-Extended Exploration	Jan 26, 2023	Reinforcement Learning (RL)	CodeCode Available	1	5
A deep inverse reinforcement learning approach to route choice modeling with context-dependent rewards	Jun 18, 2022	Computational EfficiencyDemand Forecasting	CodeCode Available	1	5
DeepMimic: Example-Guided Deep Reinforcement Learning of Physics-Based Character Skills	Apr 8, 2018	Deep Reinforcement LearningMotion Synthesis	CodeCode Available	1	5
Deep Reinforcement Learning at the Edge of the Statistical Precipice	Aug 30, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
A Scalable and Reproducible System-on-Chip Simulation for Reinforcement Learning	Apr 27, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
FedFormer: Contextual Federation with Attention in Reinforcement Learning	May 27, 2022	Federated Learningreinforcement-learning	CodeCode Available	1	5
Fine-Grained Causal Dynamics Learning with Quantization for Improving Robustness in Reinforcement Learning	Jun 5, 2024	QuantizationReinforcement Learning (RL)	CodeCode Available	1	5
DeepMind Lab2D	Nov 13, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
BabyAI 1.1	Jul 24, 2020	Computational EfficiencyImitation Learning	CodeCode Available	1	5
A Deep Reinforcement Learning Algorithm Using Dynamic Attention Model for Vehicle Routing Problems	Feb 9, 2020	Combinatorial OptimizationDecoder	CodeCode Available	1	5

Show:10 25 50

← PrevPage 58 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified