Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3276–3300 of 15113 papers

Title	Date	Tasks	Status
DDPG based on multi-scale strokes for financial time series trading strategy	Jun 5, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
Modified DDPG car-following model with a real-world human driving experience with CARLA simulator	Dec 29, 2021	Autonomous DrivingDeep Reinforcement Learning	—Unverified
DDPG++: Striving for Simplicity in Continuous-control Off-Policy Reinforcement Learning	Jun 26, 2020	continuous-controlContinuous Control	—Unverified
A Fast Convergence Theory for Offline Decision Making	Jun 3, 2024	Decision MakingOffline RL	—Unverified
Dealing with Limited Backhaul Capacity in Millimeter Wave Systems: A Deep Reinforcement Learning Approach	Dec 27, 2018	Deep Reinforcement LearningReinforcement Learning	—Unverified
Dealing with Non-Stationarity in Multi-Agent Deep Reinforcement Learning	Jun 11, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
A Hybrid Approach for Reinforcement Learning Using Virtual Policy Gradient for Balancing an Inverted Pendulum	Feb 6, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Dealing with Sparse Rewards Using Graph Neural Networks	Mar 25, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dealing with the Unknown: Pessimistic Offline Reinforcement Learning	Nov 9, 2021	reinforcement-learningReinforcement Learning	—Unverified
DEALIO: Data-Efficient Adversarial Learning for Imitation from Observation	Mar 31, 2021	Imitation LearningModel-based Reinforcement Learning	—Unverified
INTAGS: Interactive Agent-Guided Simulation	Sep 4, 2023	Algorithmic TradingCausal Inference	—Unverified
Agent Modeling as Auxiliary Task for Deep Reinforcement Learning	Jul 22, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Death and Suicide in Universal Artificial Intelligence	Jun 2, 2016	Reinforcement LearningReinforcement Learning (RL)	—Unverified
A SUMO Framework for Deep Reinforcement Learning Experiments Solving Electric Vehicle Charging Dispatching Problem	Sep 7, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
De-Biased Modelling of Search Click Behavior with Reinforcement Learning	May 21, 2021	Learning-To-Rankreinforcement-learning	—Unverified
DEAR: Deep Reinforcement Learning for Online Advertising Impression in Recommender Systems	Sep 9, 2019	ArticlesDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Online Control of Stochastic Partial Differential Equations	Oct 21, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Decentralized Automotive Radar Spectrum Allocation to Avoid Mutual Interference Using Reinforcement Learning	Jan 7, 2020	Decision Makingreinforcement-learning	—Unverified
Decentralized Circle Formation Control for Fish-like Robots in the Real-world via Reinforcement Learning	Mar 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Succinct Summary of Reinforcement Learning	Jan 3, 2023	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning for NLP	Jul 1, 2018	Atari Gamescoreference-resolution	—Unverified
A Gentle Lecture Note on Filtrations in Reinforcement Learning	Aug 6, 2020	Decision Makingreinforcement-learning	—Unverified
On Improving Model-Free Algorithms for Decentralized Multi-Agent Reinforcement Learning	Oct 12, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Decentralized Cooperative Reinforcement Learning with Hierarchical Information Structure	Nov 1, 2021	Multi-agent Reinforcement LearningMulti-Armed Bandits	—Unverified
A Subgame Perfect Equilibrium Reinforcement Learning Approach to Time-inconsistent Problems	Oct 27, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 132 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified