Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6201–6250 of 15113 papers

Title	Date	Tasks	Status
A Deep Reinforcement Learning-Based Charging Scheduling Approach with Augmented Lagrangian for Electric Vehicle	Sep 20, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Graph Value Iteration	Sep 20, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Age of Semantics in Cooperative Communications: To Expedite Simulation Towards Real via Offline Reinforcement Learning	Sep 19, 2022	Reinforcement Learning (RL)	—Unverified
Active Predicting Coding: Brain-Inspired Reinforcement Learning for Sparse Reward Robotic Control Problems	Sep 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Transferable and Automatic Tuning of Deep Reinforcement Learning for Cost Effective Phishing Detection	Sep 19, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Enforcing the consensus between Trajectory Optimization and Policy Learning for precise robot control	Sep 19, 2022	Reinforcement Learning (RL)valid	—Unverified
An information-theoretic perspective on intrinsic motivation in reinforcement learning: a survey	Sep 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
"Guess what I'm doing": Extending legibility to sequential decision tasks	Sep 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Safe reinforcement learning control for continuous-time nonlinear systems without a backup controller	Sep 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Meta-Reinforcement Learning for Adaptive Control of Second Order Systems	Sep 19, 2022	Meta-LearningMeta Reinforcement Learning	—Unverified
Rewarding Episodic Visitation Discrepancy for Exploration in Reinforcement Learning	Sep 19, 2022	Atari GamesBenchmarking	—Unverified
Measuring Interventional Robustness in Reinforcement Learning	Sep 19, 2022	Fairnessreinforcement-learning	CodeCode Available
Transferring Knowledge for Reinforcement Learning in Contact-Rich Manipulation	Sep 19, 2022	Contact-rich Manipulationreinforcement-learning	—Unverified
MSVIPER: Improved Policy Distillation for Reinforcement-Learning-Based Robot Navigation	Sep 19, 2022	Imitation Learningreinforcement-learning	—Unverified
Multi-level Explanation of Deep Reinforcement Learning-based Scheduling	Sep 18, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Simplifying Model-based RL: Learning Representations, Latent-space Models, and Policies with One Objective	Sep 18, 2022	Reinforcement Learning (RL)Value prediction	—Unverified
Offline Reinforcement Learning with Instrumental Variables in Confounded Markov Decision Processes	Sep 18, 2022	Offline RLreinforcement-learning	—Unverified
Evolutionary Deep Reinforcement Learning Using Elite Buffer: A Novel Approach Towards DRL Combined with EA in Continuous Control Tasks	Sep 18, 2022	continuous-controlContinuous Control	—Unverified
A Robust and Constrained Multi-Agent Reinforcement Learning Electric Vehicle Rebalancing Method in AMoD Systems	Sep 17, 2022	FairnessMulti-agent Reinforcement Learning	—Unverified
Intrinsically Motivated Reinforcement Learning based Recommendation with Counterfactual Data Augmentation	Sep 17, 2022	counterfactualData Augmentation	—Unverified
MA2QL: A Minimalist Approach to Fully Decentralized Multi-Agent Reinforcement Learning	Sep 17, 2022	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Selective Token Generation for Few-shot Natural Language Generation	Sep 17, 2022	Data-to-Text GenerationLanguage Modeling	CodeCode Available
Sample-Efficient Multi-Agent Reinforcement Learning with Demonstrations for Flocking Control	Sep 17, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Sub-optimal Policy Aided Multi-Agent Reinforcement Learning for Flocking Control	Sep 17, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Neuromuscular Reinforcement Learning to Actuate Human Limbs through FES	Sep 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning-Based Cooperative P2P Power Trading between DC Nanogrid Clusters with Wind and PV Energy Resources	Sep 16, 2022	energy tradingManagement	—Unverified
Trustworthy Reinforcement Learning Against Intrinsic Vulnerabilities: Robustness, Safety, and Generalizability	Sep 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Value Summation: A Novel Scoring Function for MPC-based Model-based Reinforcement Learning	Sep 16, 2022	Model-based Reinforcement LearningMuJoCo	—Unverified
Optimizing Industrial HVAC Systems with Hierarchical Reinforcement Learning	Sep 16, 2022	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Model Inversion Attacks against Graph Neural Networks	Sep 16, 2022	modelReinforcement Learning (RL)	—Unverified
M^2DQN: A Robust Method for Accelerating Deep Q-learning Network	Sep 16, 2022	Q-Learningreinforcement-learning	CodeCode Available
Conservative Dual Policy Optimization for Efficient Model-Based Reinforcement Learning	Sep 16, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Natural Language Generation for Task-oriented Dialogue via Reinforcement Learning	Sep 16, 2022	Natural Language Understandingreinforcement-learning	CodeCode Available
Deep Reinforcement Learning for Task Offloading in UAV-Aided Smart Farm Networks	Sep 15, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Can Offline Reinforcement Learning Help Natural Language Understanding?	Sep 15, 2022	Language ModelingLanguage Modelling	—Unverified
IoT-Aerial Base Station Task Offloading with Risk-Sensitive Reinforcement Learning for Smart Agriculture	Sep 15, 2022	Q-LearningReinforcement Learning (RL)	—Unverified
On the Reuse Bias in Off-Policy Reinforcement Learning	Sep 15, 2022	continuous-controlContinuous Control	CodeCode Available
Mean-Field Approximation of Cooperative Constrained Multi-Agent Reinforcement Learning (CMARL)	Sep 15, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
ProAPT: Projection of APT Threats with Deep Reinforcement Learning	Sep 15, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Understanding Deep Neural Function Approximation in Reinforcement Learning via ε-Greedy Exploration	Sep 15, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
MIXRTs: Toward Interpretable Multi-Agent Reinforcement Learning via Mixing Recurrent Soft Decision Trees	Sep 15, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Scalable Task-Driven Robotic Swarm Control via Collision Avoidance and Learning Mean-Field Control	Sep 15, 2022	Collision AvoidanceMulti-agent Reinforcement Learning	—Unverified
Robust Constrained Reinforcement Learning	Sep 14, 2022	Adversarial Attackreinforcement-learning	—Unverified
Knowledge Transfer in Deep Reinforcement Learning via an RL-Specific GAN-Based Correspondence Function	Sep 14, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available
Feature-Rich Long-term Bitcoin Trading Assistant	Sep 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Analysis of Reinforcement Learning for determining task replication in workflows	Sep 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation	Sep 14, 2022	Offline RLreinforcement-learning	—Unverified
Designing Biological Sequences via Meta-Reinforcement Learning and Bayesian Optimization	Sep 13, 2022	Bayesian Optimizationglobal-optimization	—Unverified
A new Reinforcement Learning framework to discover natural flavor molecules	Sep 13, 2022	reinforcement-learningReinforcement Learning	—Unverified
Active Perception Applied To Unmanned Aerial Vehicles Through Deep Reinforcement Learning	Sep 13, 2022	Contrastive LearningDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 125 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified