Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4826–4850 of 15113 papers

Title	Date	Tasks	Status	Hype
Soft Action Priors: Towards Robust Policy Transfer	Sep 20, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Locally Constrained Representations in Reinforcement Learning	Sep 20, 2022	continuous-controlContinuous Control	—Unverified	0
Macro-Action-Based Multi-Agent/Robot Deep Reinforcement Learning under Partial Observability	Sep 20, 2022	Decision MakingDecision Making Under Uncertainty	—Unverified	0
Asynchronous Actor-Critic for Multi-Agent Reinforcement Learning	Sep 20, 2022	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
Graph Value Iteration	Sep 20, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Deep Q-Network for AI Soccer	Sep 20, 2022	Atari Gamesreinforcement-learning	—Unverified	0
IRS Assisted NOMA Aided Mobile Edge Computing with Queue Stability: Heterogeneous Multi-Agent Reinforcement Learning	Sep 20, 2022	Edge-computingMulti-agent Reinforcement Learning	—Unverified	0
A Spiking Neural Network Learning Markov Chain	Sep 20, 2022	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
A Joint Imitation-Reinforcement Learning Framework for Reduced Baseline Regret	Sep 20, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
A Deep Reinforcement Learning-Based Charging Scheduling Approach with Augmented Lagrangian for Electric Vehicle	Sep 20, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Transferring Knowledge for Reinforcement Learning in Contact-Rich Manipulation	Sep 19, 2022	Contact-rich Manipulationreinforcement-learning	—Unverified	0
Meta-Reinforcement Learning for Adaptive Control of Second Order Systems	Sep 19, 2022	Meta-LearningMeta Reinforcement Learning	—Unverified	0
MAN: Multi-Action Networks Learning	Sep 19, 2022	Atari GamesDeep Reinforcement Learning	CodeCode Available	1
Safe reinforcement learning control for continuous-time nonlinear systems without a backup controller	Sep 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Rewarding Episodic Visitation Discrepancy for Exploration in Reinforcement Learning	Sep 19, 2022	Atari GamesBenchmarking	—Unverified	0
Measuring Interventional Robustness in Reinforcement Learning	Sep 19, 2022	Fairnessreinforcement-learning	CodeCode Available	0
MSVIPER: Improved Policy Distillation for Reinforcement-Learning-Based Robot Navigation	Sep 19, 2022	Imitation Learningreinforcement-learning	—Unverified	0
BOME! Bilevel Optimization Made Easy: A Simple First-Order Approach	Sep 19, 2022	Bilevel OptimizationContinual Learning	CodeCode Available	1
Age of Semantics in Cooperative Communications: To Expedite Simulation Towards Real via Offline Reinforcement Learning	Sep 19, 2022	Reinforcement Learning (RL)	—Unverified	0
Enforcing the consensus between Trajectory Optimization and Policy Learning for precise robot control	Sep 19, 2022	Reinforcement Learning (RL)valid	—Unverified	0
A Transferable and Automatic Tuning of Deep Reinforcement Learning for Cost Effective Phishing Detection	Sep 19, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Active Predicting Coding: Brain-Inspired Reinforcement Learning for Sparse Reward Robotic Control Problems	Sep 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Learning to Walk by Steering: Perceptive Quadrupedal Locomotion in Dynamic Environments	Sep 19, 2022	Decision MakingImitation Learning	CodeCode Available	1
"Guess what I'm doing": Extending legibility to sequential decision tasks	Sep 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Latent Plans for Task-Agnostic Offline Reinforcement Learning	Sep 19, 2022	Imitation Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 194 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified