Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13951–14000 of 15113 papers

Title	Date	Tasks	Status
Learning Local Search Heuristics for Boolean Satisfiability	Dec 1, 2019	Deep Reinforcement LearningGraph Neural Network	CodeCode Available
Faster Reinforcement Learning Using Active Simulators	Mar 22, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning that Matters	Sep 19, 2017	Atari GamesContinuous Control	CodeCode Available
A Lyapunov-based Approach to Safe Reinforcement Learning	May 20, 2018	Decision Makingreinforcement-learning	CodeCode Available
Alpha-Mini: Minichess Agent with Deep Reinforcement Learning	Dec 22, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
A Policy Gradient Primal-Dual Algorithm for Constrained MDPs with Uniform PAC Guarantees	Jan 31, 2024	Reinforcement Learning (RL)	CodeCode Available
A policy gradient approach for Finite Horizon Constrained Markov Decision Processes	Oct 10, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Learning to Deceive Knowledge Graph Augmented Models via Targeted Perturbation	Oct 24, 2020	Knowledge GraphsQuestion Answering	CodeCode Available
Directly Forecasting Belief for Reinforcement Learning with Delays	May 1, 2025	D4RLMuJoCo	CodeCode Available
Deep Reinforcement Learning Radio Control and Signal Detection with KeRLym, a Gym RL Agent	May 30, 2016	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
ALPaCA vs. GP-based Prior Learning: A Comparison between two Bayesian Meta-Learning Algorithms	Oct 15, 2020	Few-Shot LearningMeta-Learning	CodeCode Available
A Deep Reinforcement Learning Approach to Audio-Based Navigation in a Multi-Speaker Environment	May 10, 2021	Deep Reinforcement LearningNavigate	CodeCode Available
Deep Reinforcement Learning on a Budget: 3D Control and Reasoning Without a Supercomputer	Apr 3, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Direct Random Search for Fine Tuning of Deep Reinforcement Learning Policies	Sep 12, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Conditionally Elicitable Dynamic Risk Measures for Deep Reinforcement Learning	Jun 29, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Fast Rates for Maximum Entropy Exploration	Mar 14, 2023	Reinforcement Learning (RL)	CodeCode Available
Langevin DQN	Feb 17, 2020	Computational EfficiencyOpen-Ended Question Answering	CodeCode Available
Deep Reinforcement Learning of Region Proposal Networks for Object Detection	Jun 1, 2018	Deep Reinforcement LearningObject	CodeCode Available
Autonomous Navigation via Deep Reinforcement Learning for Resource Constraint Edge Nodes using Transfer Learning	Oct 12, 2019	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available
On the Correctness and Sample Complexity of Inverse Reinforcement Learning	Jun 2, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
High-Throughput Distributed Reinforcement Learning via Adaptive Policy Synchronization	Jul 15, 2025	reinforcement-learningReinforcement Learning	CodeCode Available
Discount Factor as a Regularizer in Reinforcement Learning	Jul 4, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Autonomous Management of Energy-Harvesting IoT Nodes Using Deep Reinforcement Learning	May 10, 2019	Deep Reinforcement LearningManagement	CodeCode Available
Highway Graph to Accelerate Reinforcement Learning	May 20, 2024	reinforcement-learningReinforcement Learning	CodeCode Available
Discourse Marker Augmented Network with Reinforcement Learning for Natural Language Inference	Jul 23, 2019	Natural Language Inferencereinforcement-learning	CodeCode Available
DISCOVER: Automated Curricula for Sparse-Reward Reinforcement Learning	May 26, 2025	Efficient Explorationreinforcement-learning	CodeCode Available
Deep Reinforcement Learning of Marked Temporal Point Processes	May 23, 2018	Deep Reinforcement LearningMarketing	CodeCode Available
Deep Reinforcement Learning meets Graph Neural Networks: exploring a routing optimization use case	Oct 16, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
A Low Latency Adaptive Coding Spiking Framework for Deep Reinforcement Learning	Nov 21, 2022	Deep Reinforcement LearningOffline RL	CodeCode Available
Learning Low-Frequency Motion Control for Robust and Dynamic Robot Locomotion	Sep 29, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
A Deep Reinforcement Learning Approach for Global Routing	Jun 20, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Language as an Abstraction for Hierarchical Deep Reinforcement Learning	Jun 18, 2019	Deep Reinforcement LearningInstruction Following	CodeCode Available
Autonomous Braking System via Deep Reinforcement Learning	Feb 8, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Conditional Computation in Neural Networks for faster models	Nov 19, 2015	reinforcement-learningReinforcement Learning	CodeCode Available
Deep reinforcement learning in World-Earth system models to discover sustainable management strategies	Aug 15, 2019	Deep Reinforcement LearningManagement	CodeCode Available
Hindsight Credit Assignment	Dec 5, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Discovering General-Purpose Active Learning Strategies	Oct 9, 2018	Active LearningBIG-bench Machine Learning	CodeCode Available
Deep Reinforcement Learning in Quantitative Algorithmic Trading: A Review	May 31, 2021	Algorithmic TradingDeep Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning in Large Discrete Action Spaces	Dec 24, 2015	Deep Reinforcement LearningRecommendation Systems	CodeCode Available
APO: Enhancing Reasoning Ability of MLLMs via Asymmetric Policy Optimization	Jun 26, 2025	Multimodal ReasoningReinforcement Learning (RL)	CodeCode Available
Learning to Describe for Predicting Zero-shot Drug-Drug Interactions	Mar 13, 2024	Language ModelingLanguage Modelling	CodeCode Available
Deep Reinforcement Learning for Synthesizing Functions in Higher-Order Logic	Oct 25, 2019	Automated Theorem ProvingBIG-bench Machine Learning	CodeCode Available
Faults in Deep Reinforcement Learning Programs: A Taxonomy and A Detection Approach	Jan 1, 2021	Deep Reinforcement LearningFault Detection	CodeCode Available
Automating Reinforcement Learning with Example-based Resets	Apr 5, 2022	continuous-controlContinuous Control	CodeCode Available
Deep Reinforcement Learning in Continuous Action Spaces: a Case Study in the Game of Simulated Curling	Jul 1, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Concurrent Meta Reinforcement Learning	Mar 7, 2019	Efficient ExplorationMeta-Learning	CodeCode Available
FCMNet: Full Communication Memory Net for Team-Level Cooperation in Multi-Agent Systems	Jan 28, 2022	Decision Makingreinforcement-learning	CodeCode Available
Hindsight Foresight Relabeling for Meta-Reinforcement Learning	Sep 18, 2021	Meta Reinforcement Learningreinforcement-learning	CodeCode Available
A Low-Cost Ethics Shaping Approach for Designing Reinforcement Learning Agents	Dec 12, 2017	Ethicsreinforcement-learning	CodeCode Available
Concurrent Credit Assignment for Data-efficient Reinforcement Learning	May 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 280 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified