Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 976–1000 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Active Exploration for Inverse Reinforcement Learning	Jul 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Doubly Mild Generalization for Offline Reinforcement Learning	Nov 12, 2024	MuJoCoOffline RL	CodeCode Available	1	5
Improving Model-Based Reinforcement Learning with Internal State Representations through Self-Supervision	Feb 10, 2021	Board GamesModel-based Reinforcement Learning	CodeCode Available	1	5
Dataset Reset Policy Optimization for RLHF	Apr 12, 2024	Reinforcement Learning (RL)	CodeCode Available	1	5
Can Q-Learning with Graph Networks Learn a Generalizable Branching Heuristic for a SAT Solver?	Sep 26, 2019	Feature EngineeringQ-Learning	CodeCode Available	1	5
Data-Efficient Reinforcement Learning with Self-Predictive Representations	Jul 12, 2020	Atari Games 100kData Augmentation	CodeCode Available	1	5
A Multiplicative Value Function for Safe and Efficient Reinforcement Learning	Mar 7, 2023	Navigatereinforcement-learning	CodeCode Available	1	5
Automatic Data Augmentation for Generalization in Reinforcement Learning	Dec 1, 2021	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1	5
Automatic Truss Design with Reinforcement Learning	Jun 27, 2023	Combinatorial OptimizationLayout Design	CodeCode Available	1	5
An actor-critic algorithm with policy gradients to solve the job shop scheduling problem using deep double recurrent agents	Oct 18, 2021	Deep Reinforcement LearningJob Shop Scheduling	CodeCode Available	1	5
Inclined Quadrotor Landing using Deep Reinforcement Learning	Mar 16, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
In Defense of the Unitary Scalarization for Deep Multi-Task Learning	Jan 11, 2022	Multi-Task LearningReinforcement Learning (RL)	CodeCode Available	1	5
Independent Reinforcement Learning for Weakly Cooperative Multiagent Traffic Control Problem	Apr 22, 2021	Decision Makingreinforcement-learning	CodeCode Available	1	5
Debiasing Meta-Gradient Reinforcement Learning by Learning the Outer Value Function	Nov 19, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1	5
Debiased Contrastive Learning	Jul 1, 2020	Contrastive LearningGeneralization Bounds	CodeCode Available	1	5
When should we prefer Decision Transformers for Offline Reinforcement Learning?	May 23, 2023	D4RLImitation Learning	CodeCode Available	1	5
Decentralized Structural-RNN for Robot Crowd Navigation with Deep Reinforcement Learning	Nov 9, 2020	Deep Reinforcement LearningMotion Planning	CodeCode Available	1	5
Deceptive Path Planning via Reinforcement Learning with Graph Neural Networks	Feb 9, 2024	Graph Neural Networkreinforcement-learning	CodeCode Available	1	5
Integrated Decision and Control: Towards Interpretable and Computationally Efficient Driving Intelligence	Mar 18, 2021	Autonomous DrivingModel-based Reinforcement Learning	CodeCode Available	1	5
Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient	Oct 11, 2024	MambaModel-based Reinforcement Learning	CodeCode Available	1	5
Integrating Saliency Ranking and Reinforcement Learning for Enhanced Object Detection	Aug 13, 2024	Deep Reinforcement LearningObject	CodeCode Available	1	5
Decomposed Mutual Information Optimization for Generalized Context in Meta-Reinforcement Learning	Oct 9, 2022	Decision MakingMeta Reinforcement Learning	CodeCode Available	1	5
Decomposed Soft Actor-Critic Method for Cooperative Multi-Agent Reinforcement Learning	Apr 14, 2021	counterfactualDeep Reinforcement Learning	CodeCode Available	1	5
An Alternative Softmax Operator for Reinforcement Learning	Dec 16, 2016	Decision Makingreinforcement-learning	CodeCode Available	1	5
DrM: Mastering Visual Reinforcement Learning through Dormant Ratio Minimization	Oct 30, 2023	continuous-controlContinuous Control	CodeCode Available	1	5

Show:10 25 50

← PrevPage 40 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified