Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2126–2150 of 15113 papers

Title	Date	Tasks	Status	Hype
Beyond Uniform Sampling: Offline Reinforcement Learning with Imbalanced Datasets	Oct 6, 2023	D4RLDecision Making	CodeCode Available	1
Combining Reinforcement Learning with Model Predictive Control for On-Ramp Merging	Nov 17, 2020	Autonomous DrivingModel Predictive Control	CodeCode Available	1
Deceptive Path Planning via Reinforcement Learning with Graph Neural Networks	Feb 9, 2024	Graph Neural Networkreinforcement-learning	CodeCode Available	1
Combining Semantic Guidance and Deep Reinforcement Learning For Generating Human Level Paintings	Nov 25, 2020	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	1
Decomposed Mutual Information Optimization for Generalized Context in Meta-Reinforcement Learning	Oct 9, 2022	Decision MakingMeta Reinforcement Learning	CodeCode Available	1
Decoupling Strategy and Generation in Negotiation Dialogues	Aug 29, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	1
Decoupling Value and Policy for Generalization in Reinforcement Learning	Feb 20, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Actor-Critic Learning for Distributed Power Control in Wireless Mobile Networks	Sep 14, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Black-Box Reinforcement Learning with Movement Primitives	Oct 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Deep Intrinsically Motivated Exploration in Continuous Control	Oct 1, 2022	continuous-controlContinuous Control	CodeCode Available	1
A deep inverse reinforcement learning approach to route choice modeling with context-dependent rewards	Jun 18, 2022	Computational EfficiencyDemand Forecasting	CodeCode Available	1
Comparing Observation and Action Representations for Deep Reinforcement Learning in μRTS	Oct 26, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Bidirectional Model-based Policy Optimization	Jul 4, 2020	Decision Makingmodel	CodeCode Available	1
An Efficient Asynchronous Method for Integrating Evolutionary and Gradient-based Policy Search	Dec 10, 2020	continuous-controlContinuous Control	CodeCode Available	1
Blockchain Framework for Artificial Intelligence Computation	Feb 23, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Distributional Soft Actor-Critic: Off-Policy Reinforcement Learning for Addressing Value Estimation Errors	Jan 9, 2020	continuous-controlContinuous Control	CodeCode Available	1
Computational Performance of Deep Reinforcement Learning to find Nash Equilibria	Apr 26, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Learning to combine primitive skills: A step towards versatile robotic manipulation	Aug 2, 2019	Data AugmentationImitation Learning	CodeCode Available	1
Blue River Controls: A toolkit for Reinforcement Learning Control Systems on Hardware	Jan 7, 2020	OpenAI Gymreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning based Recommendation with Explicit User-Item Interactions Modeling	Oct 29, 2018	Collaborative FilteringDecision Making	CodeCode Available	1
Deep Reinforcement Learning based Evasion Generative Adversarial Network for Botnet Detection	Oct 6, 2022	Deep Reinforcement LearningGenerative Adversarial Network	CodeCode Available	1
Deep Reinforcement Learning Control of Quantum Cartpoles	Oct 21, 2019	Deep LearningDeep Reinforcement Learning	CodeCode Available	1
Deep Reinforcement Learning for Cryptocurrency Trading: Practical Approach to Address Backtest Overfitting	Sep 12, 2022	Algorithmic TradingDeep Reinforcement Learning	CodeCode Available	1
Deep Reinforcement Learning for Active Human Pose Estimation	Jan 7, 2020	3D Human Pose EstimationDeep Reinforcement Learning	CodeCode Available	1
Bellman: A Toolbox for Model-Based Reinforcement Learning in TensorFlow	Mar 26, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 86 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified