Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4876–4900 of 15113 papers

Title	Date	Tasks	Status	Hype
Can Offline Reinforcement Learning Help Natural Language Understanding?	Sep 15, 2022	Language ModelingLanguage Modelling	—Unverified	0
IoT-Aerial Base Station Task Offloading with Risk-Sensitive Reinforcement Learning for Smart Agriculture	Sep 15, 2022	Q-LearningReinforcement Learning (RL)	—Unverified	0
Constrained Update Projection Approach to Safe Policy Optimization	Sep 15, 2022	Reinforcement Learning (RL)Safe Reinforcement Learning	CodeCode Available	1
Continuous MDP Homomorphisms and Homomorphic Policy Gradient	Sep 15, 2022	continuous-controlContinuous Control	CodeCode Available	1
COOL-MC: A Comprehensive Tool for Reinforcement Learning and Model Checking	Sep 15, 2022	OpenAI Gymreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning for Task Offloading in UAV-Aided Smart Farm Networks	Sep 15, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Mean-Field Approximation of Cooperative Constrained Multi-Agent Reinforcement Learning (CMARL)	Sep 15, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
On the Reuse Bias in Off-Policy Reinforcement Learning	Sep 15, 2022	continuous-controlContinuous Control	CodeCode Available	0
ProAPT: Projection of APT Threats with Deep Reinforcement Learning	Sep 15, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Understanding Deep Neural Function Approximation in Reinforcement Learning via ε-Greedy Exploration	Sep 15, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
MIXRTs: Toward Interpretable Multi-Agent Reinforcement Learning via Mixing Recurrent Soft Decision Trees	Sep 15, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Scalable Task-Driven Robotic Swarm Control via Collision Avoidance and Learning Mean-Field Control	Sep 15, 2022	Collision AvoidanceMulti-agent Reinforcement Learning	—Unverified	0
Analysis of Reinforcement Learning for determining task replication in workflows	Sep 14, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Feature-Rich Long-term Bitcoin Trading Assistant	Sep 14, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Knowledge Transfer in Deep Reinforcement Learning via an RL-Specific GAN-Based Correspondence Function	Sep 14, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation	Sep 14, 2022	Offline RLreinforcement-learning	—Unverified	0
Robust Constrained Reinforcement Learning	Sep 14, 2022	Adversarial Attackreinforcement-learning	—Unverified	0
Unifying Causal Inference and Reinforcement Learning using Higher-Order Category Theory	Sep 13, 2022	Causal Inferencereinforcement-learning	—Unverified	0
Designing Biological Sequences via Meta-Reinforcement Learning and Bayesian Optimization	Sep 13, 2022	Bayesian Optimizationglobal-optimization	—Unverified	0
Active Perception Applied To Unmanned Aerial Vehicles Through Deep Reinforcement Learning	Sep 13, 2022	Contrastive LearningDeep Reinforcement Learning	—Unverified	0
A new Reinforcement Learning framework to discover natural flavor molecules	Sep 13, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Data efficient reinforcement learning and adaptive optimal perimeter control of network traffic dynamics	Sep 13, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Skip Training for Multi-Agent Reinforcement Learning Controller for Industrial Wave Energy Converters	Sep 13, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Model-based Reinforcement Learning with Multi-step Plan Value Estimation	Sep 12, 2022	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Self-supervised Sequential Information Bottleneck for Robust Exploration in Deep Reinforcement Learning	Sep 12, 2022	Deep Reinforcement LearningEfficient Exploration	—Unverified	0

Show:10 25 50

← PrevPage 196 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified