Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14751–14800 of 15113 papers

Title	Date	Tasks	Status
Lifelong Inverse Reinforcement Learning	Jul 1, 2022	Lifelong learningreinforcement-learning	CodeCode Available
Counterfactual State Explanations for Reinforcement Learning Agents via Generative Deep Learning	Jan 29, 2021	counterfactualDeep Reinforcement Learning	CodeCode Available
Counterfactual Explanation with Multi-Agent Reinforcement Learning for Drug Target Prediction	Mar 24, 2021	counterfactualCounterfactual Explanation	CodeCode Available
Learning to Reach Goals via Iterated Supervised Learning	Dec 12, 2019	Multi-Goal Reinforcement LearningReinforcement Learning	CodeCode Available
Introspective Experience Replay: Look Back When Surprised	Jun 7, 2022	Q-Learningreinforcement-learning	CodeCode Available
Goal Recognition as Reinforcement Learning	Feb 13, 2022	Q-Learningreinforcement-learning	CodeCode Available
Counterfactual Explanations for Continuous Action Reinforcement Learning	May 19, 2025	counterfactualreinforcement-learning	CodeCode Available
Counterfactual-Augmented Importance Sampling for Semi-Offline Policy Evaluation	Oct 26, 2023	counterfactualOff-policy evaluation	CodeCode Available
Enhancing New-item Fairness in Dynamic Recommender Systems	Apr 30, 2025	FairnessKnowledge Distillation	CodeCode Available
Enhancing Online Reinforcement Learning with Meta-Learned Objective from Offline Data	Jan 13, 2025	Imitation LearningMuJoCo	CodeCode Available
A Robust Quantile Huber Loss With Interpretable Parameter Adjustment In Distributional Reinforcement Learning	Jan 4, 2024	Atari GamesDistributional Reinforcement Learning	CodeCode Available
Adaptive Partial Scanning Transmission Electron Microscopy with Reinforcement Learning	Apr 6, 2020	compressed sensingreinforcement-learning	CodeCode Available
Adaptive Ordered Information Extraction with Deep Reinforcement Learning	Jun 19, 2023	Deep Reinforcement LearningEvent Extraction	CodeCode Available
Adaptive Natural Language Generation for Task-oriented Dialogue via Reinforcement Learning	Sep 16, 2022	Natural Language Understandingreinforcement-learning	CodeCode Available
Enhancing variational quantum state diagonalization using reinforcement learning techniques	Jun 19, 2023	Quantum Machine Learningreinforcement-learning	CodeCode Available
Counterexample Guided RL Policy Refinement Using Bayesian Optimization	Dec 1, 2021	Bayesian OptimizationReinforcement Learning (RL)	CodeCode Available
Beyond Worst-case Attacks: Robust RL with Adaptive Defense via Non-dominated Policies	Feb 20, 2024	Adversarial AttackMuJoCo	CodeCode Available
An Empirical Comparison on Imitation Learning and Reinforcement Learning for Paraphrase Generation	Aug 28, 2019	DecoderImitation Learning	CodeCode Available
Learning Task Agnostic Skills with Data-driven Guidance	Aug 4, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
ACING: Actor-Critic for Instruction Learning in Black-Box Large Language Models	Nov 19, 2024	Reinforcement Learning (RL)	CodeCode Available
Count-Based Exploration with the Successor Representation	Jul 31, 2018	Atari GamesEfficient Exploration	CodeCode Available
A review on Deep Reinforcement Learning for Fluid Mechanics	Aug 12, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Beyond Optimism: Exploration With Partially Observable Rewards	Jun 20, 2024	BenchmarkingReinforcement Learning (RL)	CodeCode Available
Enhancing Safety for Autonomous Agents in Partly Concealed Urban Traffic Environments Through Representation-Based Shielding	Jul 5, 2024	Autonomous NavigationReinforcement Learning (RL)	CodeCode Available
Count-Based Exploration in Feature Space for Reinforcement Learning	Jun 25, 2017	Atari GamesEfficient Exploration	CodeCode Available
Cost Effective MLaaS Federation: A Combinatorial Reinforcement Learning Approach	Apr 29, 2022	BIG-bench Machine Learningreinforcement-learning	CodeCode Available
Beyond Confidence Regions: Tight Bayesian Ambiguity Sets for Robust MDPs	Feb 20, 2019	Bayesian InferencePosition	CodeCode Available
Google Research Football: A Novel Reinforcement Learning Environment	Jul 25, 2019	Game of Footballreinforcement-learning	CodeCode Available
Gossip-based Actor-Learner Architectures for Deep Reinforcement Learning	Jun 9, 2019	Deep Reinforcement LearningGPU	CodeCode Available
GoSum: Extractive Summarization of Long Documents by Reinforcement Learning and Graph Organized discourse state	Nov 18, 2022	ArticlesDocument Summarization	CodeCode Available
Enhancing Visual Dialog Questioner with Entity-based Strategy Learning and Augmented Guesser	Sep 6, 2021	DiversityReinforcement Learning (RL)	CodeCode Available
Co-Speech Gesture Synthesis by Reinforcement Learning With Contrastive Pre-Trained Rewards	Jan 1, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Ensemble and Auxiliary Tasks for Data-Efficient Deep Reinforcement Learning	Jul 5, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available
Gotta Learn Fast: A New Benchmark for Generalization in RL	Apr 10, 2018	Few-Shot Learningreinforcement-learning	CodeCode Available
An Efficient Deep Reinforcement Learning Model for Urban Traffic Control	Aug 6, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Better Safe than Sorry: Evidence Accumulation Allows for Safe Reinforcement Learning	Sep 24, 2018	Decision Makingreinforcement-learning	CodeCode Available
Controlled Interacting Particle Algorithms for Simulation-based Reinforcement Learning	Jul 2, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Corruption-Robust Offline Reinforcement Learning with General Function Approximation	Oct 23, 2023	Offline RLreinforcement-learning	CodeCode Available
Accelerating Reinforcement Learning through GPU Atari Emulation	Jul 19, 2019	Atari GamesCPU	CodeCode Available
Action Robust Reinforcement Learning and Applications in Continuous Control	Jan 26, 2019	continuous-controlContinuous Control	CodeCode Available
GRAC: Self-Guided and Self-Regularized Actor-Critic	Sep 18, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available
Better Rewards Yield Better Summaries: Learning to Summarise Without References	Sep 3, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Adaptively Calibrated Critic Estimates for Deep Reinforcement Learning	Nov 24, 2021	continuous-controlContinuous Control	CodeCode Available
Adaptive Gain Scheduling using Reinforcement Learning for Quadcopter Control	Mar 12, 2024	reinforcement-learningReinforcement Learning	CodeCode Available
BertRLFuzzer: A BERT and Reinforcement Learning Based Fuzzer	May 21, 2023	16kreinforcement-learning	CodeCode Available
Is Value Functions Estimation with Classification Plug-and-play for Offline Reinforcement Learning?	Jun 10, 2024	Deep Reinforcement LearningOffline RL	CodeCode Available
Entity Abstraction in Visual Model-Based Reinforcement Learning	Oct 28, 2019	modelModel-based Reinforcement Learning	CodeCode Available
Correct Me If You Can: Learning from Error Corrections and Markings	Apr 23, 2020	Machine Translationreinforcement-learning	CodeCode Available
An Efficient Combinatorial Optimization Model Using Learning-to-Rank Distillation	Dec 24, 2021	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available
Improving Optimization Bounds using Machine Learning: Decision Diagrams meet Deep Reinforcement Learning	Sep 10, 2018	BIG-bench Machine LearningCombinatorial Optimization	CodeCode Available

Show:10 25 50

← PrevPage 296 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified