Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3251–3300 of 15113 papers

Title	Date	Tasks	Status
Data-Efficient Reinforcement Learning in Continuous State-Action Gaussian-POMDPs	Dec 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Data-Efficient Reinforcement Learning in Continuous-State POMDPs	Feb 8, 2016	reinforcement-learningReinforcement Learning	—Unverified
Atari-GPT: Benchmarking Multimodal Large Language Models as Low-Level Policies in Atari Games	Aug 28, 2024	Atari GamesBenchmarking	—Unverified
Creativity of AI: Hierarchical Planning Model Learning for Facilitating Deep Reinforcement Learning	Dec 18, 2021	Deep Reinforcement LearningMontezuma's Revenge	—Unverified
Creativity in Robot Manipulation with Deep Reinforcement Learning	Oct 16, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Data-efficient visuomotor policy training using reinforcement learning and generative models	Jul 26, 2020	Decision MakingDisentanglement	—Unverified
Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep Reinforcement Learning Approach	Feb 21, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Data Generation Method for Learning a Low-dimensional Safe Region in Safe Reinforcement Learning	Sep 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
Accelerating Training in Pommerman with Imitation and Reinforcement Learning	Nov 12, 2019	Imitation Learningreinforcement-learning	—Unverified
Data Poisoning Attacks in Contextual Bandits	Aug 17, 2018	Data PoisoningMulti-Armed Bandits	—Unverified
Data-pooling Reinforcement Learning for Personalized Healthcare Intervention	Nov 16, 2022	Decision MakingManagement	—Unverified
Data Quality-aware Mixed-precision Quantization via Hybrid Reinforcement Learning	Feb 9, 2023	Quantizationreinforcement-learning	—Unverified
Deep reinforcement learning for optical systems: A case study of mode-locked lasers	Jun 10, 2020	Deep Reinforcement LearningNavigate	—Unverified
Deep Reinforcement Learning for Optimal Critical Care Pain Management with Morphine using Dueling Double-Deep Q Networks	Apr 25, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Creating Pro-Level AI for a Real-Time Fighting Game Using Deep Reinforcement Learning	Apr 8, 2019	Board GamesDeep Reinforcement Learning	—Unverified
A Temporal Difference Reinforcement Learning Theory of Emotion: unifying emotion, cognition and adaptive behavior	Jul 24, 2018	Learning TheoryReinforcement Learning	—Unverified
Data Sharing without Rewards in Multi-Task Offline Reinforcement Learning	Sep 29, 2021	Multi-Task LearningOffline RL	—Unverified
Data Valuation for Offline Reinforcement Learning	May 19, 2022	Data ValuationDeep Reinforcement Learning	—Unverified
A Tensor Network Approach to Finite Markov Decision Processes	Feb 12, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Creating a Dynamic Quadrupedal Robotic Goalkeeper with Reinforcement Learning	Oct 10, 2022	reinforcement-learningReinforcement Learning	—Unverified
A Surrogate-Assisted Controller for Expensive Evolutionary Reinforcement Learning	Jan 1, 2022	continuous-controlContinuous Control	—Unverified
DCE: Offline Reinforcement Learning With Double Conservative Estimates	Sep 27, 2022	Computational EfficiencyD4RL	—Unverified
DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in Complex Environments	Sep 7, 2022	Reinforcement Learning (RL)	—Unverified
A Theoretical Analysis of Optimistic Proximal Policy Optimization in Linear Markov Decision Processes	May 15, 2023	2kReinforcement Learning (RL)	—Unverified
Group-Agent Reinforcement Learning	Feb 10, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
DDPG based on multi-scale strokes for financial time series trading strategy	Jun 5, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
Modified DDPG car-following model with a real-world human driving experience with CARLA simulator	Dec 29, 2021	Autonomous DrivingDeep Reinforcement Learning	—Unverified
DDPG++: Striving for Simplicity in Continuous-control Off-Policy Reinforcement Learning	Jun 26, 2020	continuous-controlContinuous Control	—Unverified
A Fast Convergence Theory for Offline Decision Making	Jun 3, 2024	Decision MakingOffline RL	—Unverified
Dealing with Limited Backhaul Capacity in Millimeter Wave Systems: A Deep Reinforcement Learning Approach	Dec 27, 2018	Deep Reinforcement LearningReinforcement Learning	—Unverified
Dealing with Non-Stationarity in Multi-Agent Deep Reinforcement Learning	Jun 11, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
A Hybrid Approach for Reinforcement Learning Using Virtual Policy Gradient for Balancing an Inverted Pendulum	Feb 6, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Dealing with Sparse Rewards Using Graph Neural Networks	Mar 25, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dealing with the Unknown: Pessimistic Offline Reinforcement Learning	Nov 9, 2021	reinforcement-learningReinforcement Learning	—Unverified
DEALIO: Data-Efficient Adversarial Learning for Imitation from Observation	Mar 31, 2021	Imitation LearningModel-based Reinforcement Learning	—Unverified
INTAGS: Interactive Agent-Guided Simulation	Sep 4, 2023	Algorithmic TradingCausal Inference	—Unverified
Agent Modeling as Auxiliary Task for Deep Reinforcement Learning	Jul 22, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Death and Suicide in Universal Artificial Intelligence	Jun 2, 2016	Reinforcement LearningReinforcement Learning (RL)	—Unverified
A SUMO Framework for Deep Reinforcement Learning Experiments Solving Electric Vehicle Charging Dispatching Problem	Sep 7, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
De-Biased Modelling of Search Click Behavior with Reinforcement Learning	May 21, 2021	Learning-To-Rankreinforcement-learning	—Unverified
DEAR: Deep Reinforcement Learning for Online Advertising Impression in Recommender Systems	Sep 9, 2019	ArticlesDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Online Control of Stochastic Partial Differential Equations	Oct 21, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Decentralized Automotive Radar Spectrum Allocation to Avoid Mutual Interference Using Reinforcement Learning	Jan 7, 2020	Decision Makingreinforcement-learning	—Unverified
Decentralized Circle Formation Control for Fish-like Robots in the Real-world via Reinforcement Learning	Mar 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Succinct Summary of Reinforcement Learning	Jan 3, 2023	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning for NLP	Jul 1, 2018	Atari Gamescoreference-resolution	—Unverified
A Gentle Lecture Note on Filtrations in Reinforcement Learning	Aug 6, 2020	Decision Makingreinforcement-learning	—Unverified
On Improving Model-Free Algorithms for Decentralized Multi-Agent Reinforcement Learning	Oct 12, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Decentralized Cooperative Reinforcement Learning with Hierarchical Information Structure	Nov 1, 2021	Multi-agent Reinforcement LearningMulti-Armed Bandits	—Unverified
A Subgame Perfect Equilibrium Reinforcement Learning Approach to Time-inconsistent Problems	Oct 27, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 66 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified