Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7551–7600 of 15113 papers

Title	Date	Tasks	Status	Hype
Identifying optimal cycles in quantum thermal machines with reinforcement-learning	Aug 30, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Learning Meta Representations for Agents in Multi-Agent Reinforcement Learning	Aug 30, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Integrated Decision and Control at Multi-Lane Intersections with Mixed Traffic Flow	Aug 30, 2021	Autonomous DrivingModel Predictive Control	—Unverified	0
SurRoL: An Open-source Reinforcement Learning Centered and dVRK Compatible Platform for Surgical Robot Learning	Aug 30, 2021	Reinforcement Learning (RL)	CodeCode Available	1
Reinforcement Learning Based Sparse Black-box Adversarial Attack on Video Recognition Models	Aug 29, 2021	Adversarial Attackreinforcement-learning	—Unverified	0
A Policy Efficient Reduction Approach to Convex Constrained Deep Reinforcement Learning	Aug 29, 2021	Deep Reinforcement LearningGeneral Reinforcement Learning	—Unverified	0
Influence-Based Reinforcement Learning for Intrinsically-Motivated Agents	Aug 28, 2021	counterfactualMulti-agent Reinforcement Learning	—Unverified	0
Active Inference for Stochastic Control	Aug 27, 2021	Reinforcement Learning (RL)	CodeCode Available	1
Deep Reinforcement Learning for Wireless Resource Allocation Using Buffer State Information	Aug 27, 2021	Deep Reinforcement LearningFairness	—Unverified	0
Reinforcement Learning based Condition-oriented Maintenance Scheduling for Flow Line Systems	Aug 27, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
ReGen: Reinforcement Learning for Text and Knowledge Base Generation using Pretrained Language Models	Aug 27, 2021	Graph GenerationJoint Entity and Relation Extraction	CodeCode Available	1
Reinforcement Learning-powered Semantic Communication via Semantic Similarity	Aug 27, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
WAD: A Deep Reinforcement Learning Agent for Urban Autonomous Driving	Aug 27, 2021	Atari GamesAutonomous Driving	—Unverified	0
Deep Reinforcement Learning for Dynamic Band Switch in Cellular-Connected UAV	Aug 26, 2021	Deep Reinforcement LearningQ-Learning	—Unverified	0
Federated Reinforcement Learning: Techniques, Applications, and Open Challenges	Aug 26, 2021	Edge-computingFederated Learning	—Unverified	0
Adaptive Control of Differentially Private Linear Quadratic Systems	Aug 26, 2021	Reinforcement Learning (RL)	—Unverified	0
Model-based Chance-Constrained Reinforcement Learning via Separated Proportional-Integral Lagrangian	Aug 26, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Robust Model-based Reinforcement Learning for Autonomous Greenhouse Control	Aug 26, 2021	Decision MakingModel-based Reinforcement Learning	—Unverified	0
When should agents explore?	Aug 26, 2021	DiversityReinforcement Learning (RL)	—Unverified	0
Responsive Regulation of Dynamic UAV Communication Networks Based on Deep Reinforcement Learning	Aug 25, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Adversary agent reinforcement learning for pursuit-evasion	Aug 25, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning in Computer Vision: A Comprehensive Survey	Aug 25, 2021	Deep Reinforcement LearningImage Segmentation	—Unverified	0
Self-optimizing adaptive optics control with Reinforcement Learning for high-contrast imaging	Aug 24, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Entropy-Aware Model Initialization for Effective Exploration in Deep Reinforcement Learning	Aug 24, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Robust Risk-Aware Reinforcement Learning	Aug 23, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Power Grid Cascading Failure Mitigation by Reinforcement Learning	Aug 23, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
No DBA? No regret! Multi-armed bandits for index tuning of analytical and HTAP workloads with provable guarantees	Aug 23, 2021	Decision MakingDecision Making Under Uncertainty	—Unverified	0
Collect & Infer -- a fresh look at data-efficient Reinforcement Learning	Aug 23, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
A Boosting Approach to Reinforcement Learning	Aug 22, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
MimicBot: Combining Imitation and Reinforcement Learning to win in Bot Bowl	Aug 21, 2021	Decision MakingImitation Learning	—Unverified	0
An Independent Study of Reinforcement Learning and Autonomous Driving	Aug 20, 2021	Autonomous DrivingOpenAI Gym	—Unverified	0
Explainable Reinforcement Learning for Broad-XAI: A Conceptual Framework and Survey	Aug 20, 2021	Decision MakingExplainable artificial intelligence	—Unverified	0
Crown Jewels Analysis using Reinforcement Learning with Attack Graphs	Aug 20, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning to Optimize Lifetime Value in Cold-Start Recommendation	Aug 20, 2021	Recommendation Systemsreinforcement-learning	—Unverified	0
Plug and Play, Model-Based Reinforcement Learning	Aug 20, 2021	modelModel-based Reinforcement Learning	—Unverified	0
Cooperative Localization Utilizing Reinforcement Learning for 5G Networks	Aug 19, 2021	Autonomous VehiclesPosition	—Unverified	0
Global Convergence of the ODE Limit for Online Actor-Critic Algorithms in Reinforcement Learning	Aug 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A Reinforcement Learning Approach for GNSS Spoofing Attack Detection of Autonomous Vehicles	Aug 19, 2021	Autonomous VehiclesDeep Reinforcement Learning	—Unverified	0
Settling the Variance of Multi-Agent Policy Gradients	Aug 19, 2021	MuJoCoReinforcement Learning (RL)	CodeCode Available	1
Trends in Neural Architecture Search: Towards the Acceleration of Search	Aug 19, 2021	Evolutionary AlgorithmsNeural Architecture Search	—Unverified	0
Provable Benefits of Actor-Critic Methods for Offline Reinforcement Learning	Aug 19, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Explainable Deep Reinforcement Learning Using Introspection in a Non-episodic Task	Aug 18, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
End-to-End Urban Driving by Imitating a Reinforcement Learning Coach	Aug 18, 2021	Autonomous DrivingImitation Learning	CodeCode Available	1
Reinforce Attack: Adversarial Attack against BERT with Reinforcement Learning	Aug 17, 2021	Adversarial AttackAdversarial Text	—Unverified	0
Optimal Placement of Public Electric Vehicle Charging Stations Using Deep Reinforcement Learning	Aug 17, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Revisiting State Augmentation methods for Reinforcement Learning with Stochastic Delays	Aug 17, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Monolithic vs. hybrid controller for multi-objective Sim-to-Real learning	Aug 17, 2021	Reinforcement Learning (RL)	CodeCode Available	0
The Ecosystem Path to General AI	Aug 17, 2021	Reinforcement Learning (RL)Unity	—Unverified	0
Heterotic String Model Building with Monad Bundles and Reinforcement Learning	Aug 16, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Introduction to Quantum Reinforcement Learning: Theory and PennyLane-based Implementation	Aug 16, 2021	BIG-bench Machine LearningLearning Theory	—Unverified	0

Show:10 25 50

← PrevPage 152 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified