Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8301–8350 of 15113 papers

Title	Date	Tasks	Status	Hype
Curious Exploration and Return-based Memory Restoration for Deep Reinforcement Learning	May 2, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
BACKDOORL: Backdoor Attack against Competitive Reinforcement Learning	May 2, 2021	Atari GamesBackdoor Attack	—Unverified	0
Better than the Best: Gradient-based Improper Reinforcement Learning for Network Scheduling	May 1, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Mean Field MARL Based Bandwidth Negotiation Method for Massive Devices Spectrum Sharing	Apr 30, 2021	Decision MakingDistributed Optimization	—Unverified	0
Mitigating Political Bias in Language Models Through Reinforced Calibration	Apr 30, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Nearest-Neighbor-based Collision Avoidance for Quadrotors via Reinforcement Learning	Apr 30, 2021	Collision AvoidanceGeneral Reinforcement Learning	—Unverified	0
Discrete-Time Mean Field Control with Environment States	Apr 30, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Emotional Contagion-Aware Deep Reinforcement Learning for Antagonistic Crowd Simulation	Apr 29, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Adapting to Reward Progressivity via Spectral Reinforcement Learning	Apr 29, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Hypernetwork Dismantling via Deep Reinforcement Learning	Apr 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Constructions in combinatorics via neural networks	Apr 29, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Medium Access using Distributed Reinforcement Learning for IoTs with Low-Complexity Wireless Transceivers	Apr 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Pre-training of Deep RL Agents for Improved Learning under Domain Randomization	Apr 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
What is Going on Inside Recurrent Meta Reinforcement Learning Agents?	Apr 29, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Using Meta Reinforcement Learning to Bridge the Gap between Simulation and Experiment in Energy Demand Response	Apr 29, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Adversarial Inverse Reinforcement Learning for Mean Field Games	Apr 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Reward (Mis)design for Autonomous Driving	Apr 28, 2021	Autonomous Drivingreinforcement-learning	—Unverified	0
A Generalized Projected Bellman Error for Off-policy Value Estimation in Reinforcement Learning	Apr 28, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A Reinforcement Learning Environment for Polyhedral Optimizations	Apr 28, 2021	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
End-to-End Intersection Handling using Multi-Agent Deep Reinforcement Learning	Apr 28, 2021	Deep Reinforcement LearningNavigate	—Unverified	0
Implementing Reinforcement Learning Algorithms in Retail Supply Chains with OpenAI Gym Toolkit	Apr 27, 2021	Demand ForecastingManagement	—Unverified	0
Controlling earthquake-like instabilities using artificial intelligence	Apr 27, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Scalable and Reproducible System-on-Chip Simulation for Reinforcement Learning	Apr 27, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Adaptive Adversarial Training for Meta Reinforcement Learning	Apr 27, 2021	Generative Adversarial NetworkMeta-Learning	—Unverified	0
Semi-On-Policy Training for Sample Efficient Multi-Agent Policy Gradients	Apr 27, 2021	Multi-agent Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Computational Performance of Deep Reinforcement Learning to find Nash Equilibria	Apr 26, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
End-to-end grasping policies for human-in-the-loop robots via deep reinforcement learning	Apr 26, 2021	Deep Reinforcement LearningElectromyography (EMG)	CodeCode Available	0
ANT: Learning Accurate Network Throughput for Better Adaptive Video Streaming	Apr 26, 2021	Reinforcement Learning (RL)	—Unverified	0
Constraint-Guided Reinforcement Learning: Augmenting the Agent-Environment-Interaction	Apr 24, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
A Deep Reinforcement Learning Approach for the Meal Delivery Problem	Apr 24, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Graph Neural Network Reinforcement Learning for Autonomous Mobility-on-Demand Systems	Apr 23, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
DisCo RL: Distribution-Conditioned Reinforcement Learning for General-Purpose Policies	Apr 23, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Safe Chance Constrained Reinforcement Learning for Batch Process Control	Apr 23, 2021	Gaussian ProcessesModel Predictive Control	CodeCode Available	0
Reinforcement Learning using Guided Observability	Apr 22, 2021	Decision MakingMuJoCo	—Unverified	0
Reset-Free Reinforcement Learning via Multi-Task Learning: Learning Dexterous Manipulation Behaviors without Human Intervention	Apr 22, 2021	Multi-Task LearningReinforcement Learning (RL)	—Unverified	0
A learning gap between neuroscience and reinforcement learning	Apr 22, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Formula RL: Deep Reinforcement Learning for Autonomous Racing using Telemetry Data	Apr 22, 2021	Autonomous RacingDeep Reinforcement Learning	—Unverified	0
Independent Reinforcement Learning for Weakly Cooperative Multiagent Traffic Control Problem	Apr 22, 2021	Decision Makingreinforcement-learning	CodeCode Available	1
Policy Fusion for Adaptive and Customizable Reinforcement Learning Agents	Apr 21, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Model-aided Deep Reinforcement Learning for Sample-efficient UAV Trajectory Design in IoT Networks	Apr 21, 2021	Deep Reinforcement LearningQ-Learning	—Unverified	0
Tackling Variabilities in Autonomous Driving	Apr 21, 2021	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Reinforcement Learning for Traffic Signal Control: Comparison with Commercial Systems	Apr 21, 2021	Q-Learningreinforcement-learning	—Unverified	0
CVLight: Decentralized Learning for Adaptive Traffic Signal Control with Connected Vehicles	Apr 21, 2021	Reinforcement Learning (RL)Traffic Signal Control	—Unverified	0
DRL: Deep Reinforcement Learning for Intelligent Robot Control -- Concept, Literature, and Future	Apr 20, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Discovering an Aid Policy to Minimize Student Evasion Using Offline Reinforcement Learning	Apr 20, 2021	ClusteringDecision Making	—Unverified	0
Scalable Synthesis of Verified Controllers in Deep Reinforcement Learning	Apr 20, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Network-wide traffic signal control optimization using a multi-agent deep reinforcement learning	Apr 20, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
MBRL-Lib: A Modular Library for Model-based Reinforcement Learning	Apr 20, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	2
Outcome-Driven Reinforcement Learning via Variational Inference	Apr 20, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Model-predictive control and reinforcement learning in multi-energy system case studies	Apr 20, 2021	BenchmarkingModel Predictive Control	—Unverified	0

Show:10 25 50

← PrevPage 167 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified