Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14601–14650 of 15113 papers

Title	Date	Tasks	Status
DARLA: Improving Zero-Shot Transfer in Reinforcement Learning	Jul 26, 2017	Deep Reinforcement LearningDomain Adaptation	CodeCode Available
d3rlpy: An Offline Deep Reinforcement Learning Library	Nov 6, 2021	D4RLDeep Reinforcement Learning	CodeCode Available
Ask Before You Act: Generalising to Novel Environments by Asking Questions	Sep 10, 2022	Reinforcement Learning (RL)	CodeCode Available
Active Collection of Well-Being and Health Data in Mobile Devices	Jul 7, 2023	Q-LearningReinforcement Learning (RL)	CodeCode Available
Leveraging Unlabeled Data Sharing through Kernel Function Approximation in Offline Reinforcement Learning	Aug 22, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available
ELF: An Extensive, Lightweight and Flexible Research Platform for Real-time Strategy Games	Jul 4, 2017	Atari GamesGPU	CodeCode Available
LExCI: A Framework for Reinforcement Learning with Embedded Systems	Dec 5, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
BQSched: A Non-intrusive Scheduler for Batch Concurrent Queries via Reinforcement Learning	Apr 27, 2025	Reinforcement Learning (RL)Scheduling	CodeCode Available
ELO-Rated Sequence Rewards: Advancing Reinforcement Learning Models	Sep 5, 2024	reinforcement-learningReinforcement Learning	CodeCode Available
Improved Off-policy Reinforcement Learning in Biological Sequence Design	Oct 6, 2024	reinforcement-learningReinforcement Learning	CodeCode Available
A Generalised and Adaptable Reinforcement Learning Stopping Method	May 3, 2025	reinforcement-learningReinforcement Learning	CodeCode Available
A dynamical clipping approach with task feedback for Proximal Policy Optimization	Dec 12, 2023	Language ModellingLarge Language Model	CodeCode Available
Generative Adversarial Network for Abstractive Text Summarization	Nov 26, 2017	Abstractive Text SummarizationGenerative Adversarial Network	CodeCode Available
Learning Explicit Credit Assignment for Cooperative Multi-Agent Reinforcement Learning via Polarization Policy Gradient	Oct 10, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Embodied Question Answering	Nov 30, 2017	Embodied Question AnsweringNavigate	CodeCode Available
CytonRL: an Efficient Reinforcement Learning Open-source Toolkit Implemented in C++	Apr 14, 2018	GPUQ-Learning	CodeCode Available
Cyclic Policy Distillation: Sample-Efficient Sim-to-Real Reinforcement Learning with Domain Randomization	Jul 29, 2022	Deep Reinforcement LearningMuJoCo	CodeCode Available
A Bayesian Approach to Reinforcement Learning of Vision-Based Vehicular Control	Apr 8, 2021	Autonomous Drivingreinforcement-learning	CodeCode Available
Learning Curriculum Policies for Reinforcement Learning	Dec 1, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Generative Adversarial User Model for Reinforcement Learning Based Recommendation System	Dec 27, 2018	Generative Adversarial NetworkModel-based Reinforcement Learning	CodeCode Available
Bounding the Optimal Value Function in Compositional Reinforcement Learning	Mar 5, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Emergence of Compositional Language with Deep Generational Transmission	Apr 19, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Visual Exploration and Energy-aware Path Planning via Reinforcement Learning	Sep 26, 2019	Autonomous Vehiclesobject-detection	CodeCode Available
Self-organization of action hierarchy and compositionality by reinforcement learning with recurrent neural networks	Jan 29, 2019	continuous-controlContinuous Control	CodeCode Available
Emergence of Linguistic Communication from Referential Games with Symbolic and Pixel Input	Apr 11, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Learning data augmentation policies using augmented random search	Nov 12, 2018	Data Augmentationreinforcement-learning	CodeCode Available
Cycle-of-Learning for Autonomous Systems from Human Interaction	Aug 28, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Emergence of Pragmatics from Referential Game between Theory of Mind Agents	Jan 21, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Improved robustness of reinforcement learning policies upon conversion to spiking neuronal network platforms applied to ATARI games	Mar 26, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Improved Sample Complexity Bounds for Distributionally Robust Reinforcement Learning	Mar 5, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
A General Framework for Structured Learning of Mechanical Systems	Feb 22, 2019	Model-based Reinforcement LearningReinforcement Learning	CodeCode Available
Curriculum RL meets Monte Carlo Planning: Optimization of a Real World Container Management Problem	Mar 21, 2025	Collision AvoidanceManagement	CodeCode Available
AACHER: Assorted Actor-Critic Deep Reinforcement Learning with Hindsight Experience Replay	Oct 24, 2022	Deep Reinforcement LearningFetchPush-v1	CodeCode Available
Curriculum Design for Teaching via Demonstrations: Theory and Applications	Jun 8, 2021	Decision MakingReinforcement Learning (RL)	CodeCode Available
Emergent Complexity and Zero-shot Transfer via Unsupervised Environment Design	Dec 3, 2020	Reinforcement Learning (RL)Transfer Learning	CodeCode Available
Generative Modelling of Stochastic Actions with Arbitrary Constraints in Reinforcement Learning	Nov 26, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Harnessing Reinforcement Learning for Neural Motion Planning	Jun 1, 2019	Motion Planningreinforcement-learning	CodeCode Available
Emergent Dominance Hierarchies in Reinforcement Learning Agents	Jan 21, 2024	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Generative Planning for Temporally Coordinated Exploration in Reinforcement Learning	Jan 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Emergent Linguistic Phenomena in Multi-Agent Communication Games	Jan 25, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
CURIOUS: Intrinsically Motivated Modular Multi-Goal Reinforcement Learning	Oct 15, 2018	DiversityEfficient Exploration	CodeCode Available
Curious Exploration and Return-based Memory Restoration for Deep Reinforcement Learning	May 2, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Generative Question Refinement with Deep Reinforcement Learning in Retrieval-based QA System	Aug 13, 2019	Deep Reinforcement LearningQuestion Answering	CodeCode Available
EMI: Exploration with Mutual Information	Oct 2, 2018	continuous-controlContinuous Control	CodeCode Available
Active Advantage-Aligned Online Reinforcement Learning with Offline Data	Feb 11, 2025	Offline RLreinforcement-learning	CodeCode Available
EMORL: Ensemble Multi-Objective Reinforcement Learning for Efficient and Flexible LLM Fine-Tuning	May 5, 2025	Ensemble LearningLarge Language Model	CodeCode Available
Learning Sparse Rewarded Tasks from Sub-Optimal Demonstrations	Apr 1, 2020	continuous-controlContinuous Control	CodeCode Available
Generic Itemset Mining Based on Reinforcement Learning	May 17, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Genes in Intelligent Agents	Jun 17, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Network Randomization: A Simple Technique for Generalization in Deep Reinforcement Learning	Oct 11, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 293 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified