Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7601–7650 of 15113 papers

Title	Date	Tasks	Status	Hype
Implicitly Regularized RL with Implicit Q-Values	Aug 16, 2021	Reinforcement Learning (RL)	—Unverified	0
Using Cyber Terrain in Reinforcement Learning for Penetration Testing	Aug 16, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
The Emergence of Wireless MAC Protocols with Multi-Agent Reinforcement Learning	Aug 16, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Neural-to-Tree Policy Distillation with Policy Improvement Criterion	Aug 16, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Optimal Scheduling of Isolated Microgrids Using Automated Reinforcement Learning-based Multi-period Forecasting	Aug 15, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning to Assign: Towards Fair Task Assignment in Large-Scale Ride Hailing	Aug 14, 2021	Fairnessreinforcement-learning	—Unverified	0
A Microscopic Pandemic Simulator for Pandemic Prediction Using Scalable Million-Agent Reinforcement Learning	Aug 14, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Fractional Transfer Learning for Deep Model-Based Reinforcement Learning	Aug 14, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Adaptive Selection of Informative Path Planning Strategies via Reinforcement Learning	Aug 14, 2021	GPRPrediction	—Unverified	0
Offline-Online Reinforcement Learning for Energy Pricing in Office Demand Response: Lowering Energy and Data Costs	Aug 14, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Safe Learning in Robotics: From Learning-Based Control to Safe Reinforcement Learning	Aug 13, 2021	Decision Makingreinforcement-learning	CodeCode Available	1
Reinforcement Learning for Robot Navigation with Adaptive Forward Simulation Time (AFST) in a Semi-Markov Model	Aug 13, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Q-Mixing Network for Multi-Agent Pathfinding in Partially Observable Grid Environments	Aug 13, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Aspect Sentiment Triplet Extraction Using Reinforcement Learning	Aug 13, 2021	Aspect Sentiment Triplet Extractionreinforcement-learning	CodeCode Available	1
Continual Backprop: Stochastic Gradient Descent with Persistent Randomness	Aug 13, 2021	Continual LearningReinforcement Learning (RL)	CodeCode Available	1
A general class of surrogate functions for stable and efficient reinforcement learning	Aug 12, 2021	MuJoCoPolicy Gradient Methods	CodeCode Available	0
Reinforcement Learning Approach to Active Learning for Image Classification	Aug 12, 2021	Active LearningBIG-bench Machine Learning	—Unverified	0
HAC Explore: Accelerating Exploration with Hierarchical Reinforcement Learning	Aug 12, 2021	continuous-controlContinuous Control	—Unverified	0
Gap-Dependent Unsupervised Exploration for Reinforcement Learning	Aug 11, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Fairness Through Counterfactual Utilities	Aug 11, 2021	BIG-bench Machine Learningcounterfactual	CodeCode Available	0
An Approach to Partial Observability in Games: Learning to Both Act and Observe	Aug 11, 2021	Atari GamesReinforcement Learning (RL)	—Unverified	0
Integrating process design and control using reinforcement learning	Aug 11, 2021	Bilevel Optimizationreinforcement-learning	—Unverified	0
Does Explicit Prediction Matter in Deep Reinforcement Learning-Based Energy Management?	Aug 11, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Low-level Pose Control of Tilting Multirotor for Wall Perching Tasks Using Reinforcement Learning	Aug 11, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Truncated Emphatic Temporal Difference Methods for Prediction and Control	Aug 11, 2021	PredictionReinforcement Learning (RL)	—Unverified	0
High Quality Related Search Query Suggestions using Deep Reinforcement Learning	Aug 10, 2021	Deep Reinforcement LearningDiversity	—Unverified	0
Imitation Learning by Reinforcement Learning	Aug 10, 2021	continuous-controlContinuous Control	CodeCode Available	0
Deep Reinforcement Learning for Demand Driven Services in Logistics and Transportation Systems: A Survey	Aug 10, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
A Survey on Deep Reinforcement Learning for Data Processing and Analytics	Aug 10, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Knowledge accumulating: The general pattern of learning	Aug 9, 2021	image-classificationImage Classification	—Unverified	0
Bob and Alice Go to a Bar: Reasoning About Future With Probabilistic Programs	Aug 9, 2021	Bayesian InferenceProbabilistic Programming	—Unverified	0
Paint Transformer: Feed Forward Neural Painting with Stroke Prediction	Aug 9, 2021	Object DetectionPrediction	CodeCode Available	1
Safe Deep Reinforcement Learning for Multi-Agent Systems with Continuous Action Spaces	Aug 9, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Mis-spoke or mis-lead: Achieving Robustness in Multi-Agent Communicative Reinforcement Learning	Aug 9, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
VeRLPy: Python Library for Verification of Digital Designs with Reinforcement Learning	Aug 9, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
On the Difficulty of Generalizing Reinforcement Learning Framework for Combinatorial Optimization	Aug 8, 2021	Combinatorial OptimizationGraph Neural Network	—Unverified	0
Meta-Reinforcement Learning in Broad and Non-Parametric Environments	Aug 8, 2021	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	0
Online Bootstrap Inference For Policy Evaluation in Reinforcement Learning	Aug 8, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Proxemic Behavior Using Reinforcement Learning with Cognitive Agents	Aug 8, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Efficient Representation for Electric Vehicle Charging Station Operations using Reinforcement Learning	Aug 7, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Deep Reinforcement Learning for Intelligent Reflecting Surface-assisted D2D Communications	Aug 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Study on Dense and Sparse (Visual) Rewards in Robot Policy Learning	Aug 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Building a Foundation for Data-Driven, Interpretable, and Robust Policy Design using the AI Economist	Aug 6, 2021	Reinforcement Learning (RL)	CodeCode Available	1
Semantic Tracklets: An Object-Centric Representation for Visual Multi-Agent Reinforcement Learning	Aug 6, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
What Matters in Learning from Offline Human Demonstrations for Robot Manipulation	Aug 6, 2021	Imitation Learningreinforcement-learning	CodeCode Available	2
Distilling Neuron Spike with High Temperature in Reinforcement Learning Agents	Aug 5, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
An Elementary Proof that Q-learning Converges Almost Surely	Aug 5, 2021	Q-Learningreinforcement-learning	—Unverified	0
An Encoder-Decoder Based Audio Captioning System With Transfer and Reinforcement Learning	Aug 5, 2021	Audio captioningDecoder	CodeCode Available	1
Reinforcement Learning for Intelligent Healthcare Systems: A Comprehensive Survey	Aug 5, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Responding to Illegal Activities Along the Canadian Coastlines Using Reinforcement Learning	Aug 5, 2021	FADreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 153 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified