Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9601–9650 of 15113 papers

Title	Date	Tasks	Status
A Methodology for the Development of RL-Based Adaptive Traffic Signal Controllers	Jan 24, 2021	Experimental Designreinforcement-learning	—Unverified
Solving optimal stopping problems with Deep Q-Learning	Jan 24, 2021	Q-LearningReinforcement Learning (RL)	—Unverified
Decoupled Exploration and Exploitation Policies for Sample-Efficient Reinforcement Learning	Jan 23, 2021	continuous-controlContinuous Control	—Unverified
Safe Learning and Optimization Techniques: Towards a Survey of the State of the Art	Jan 23, 2021	Active LearningEvolutionary Algorithms	—Unverified
Feature Selection Using Reinforcement Learning	Jan 23, 2021	Dimensionality Reductionfeature selection	—Unverified
BF++: a language for general-purpose program synthesis	Jan 23, 2021	Decision MakingOpenAI Gym	CodeCode Available
Theory of Mind for Deep Reinforcement Learning in Hanabi	Jan 22, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Prior Preference Learning from Experts:Designing a Reward with Active Inference	Jan 22, 2021	Reinforcement Learning (RL)	—Unverified
Model-based Policy Search for Partially Measurable Systems	Jan 21, 2021	Gaussian Processesmodel	—Unverified
Adversarial Machine Learning for Flooding Attacks on 5G Radio Access Network Slicing	Jan 21, 2021	BIG-bench Machine LearningReinforcement Learning (RL)	—Unverified
Flocking and Collision Avoidance for a Dynamic Squad of Fixed-Wing UAVs Using Deep Reinforcement Learning	Jan 20, 2021	Collision AvoidanceDecision Making	—Unverified
Deep Reinforcement Learning Optimizes Graphene Nanopores for Efficient Desalination	Jan 19, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Bicycle Dispatching of Dockless Public Bicycle-sharing Systems using Multi-objective Reinforcement Learning	Jan 19, 2021	Multi-Objective Reinforcement LearningReinforcement Learning (RL)	—Unverified
Meta-Reinforcement Learning for Adaptive Motor Control in Changing Robot Dynamics and Environments	Jan 19, 2021	FrictionMeta-Learning	—Unverified
Spatial Assembly: Generative Architecture With Reinforcement Learning, Self Play and Tree Search	Jan 19, 2021	reinforcement-learningReinforcement Learning	—Unverified
Regularized Policies are Reward Robust	Jan 18, 2021	reinforcement-learningReinforcement Learning	—Unverified
Stable deep reinforcement learning method by predicting uncertainty in rewards as a subtask	Jan 18, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Model-Based Reinforcement Learning for Approximate Optimal Control with Temporal Logic Specifications	Jan 18, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Cooperative and Competitive Biases for Multi-Agent Reinforcement Learning	Jan 18, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Natural Language Specification of Reinforcement Learning Policies through Differentiable Decision Trees	Jan 18, 2021	BIG-bench Machine Learningreinforcement-learning	—Unverified
HAMMER: Multi-Level Coordination of Reinforcement Learning Agents via Learned Messaging	Jan 18, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Deep Reinforcement Learning with Embedded LQR Controllers	Jan 18, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
CLASTER: Clustering with Reinforcement Learning for Zero-Shot Action Recognition	Jan 18, 2021	Action RecognitionClustering	—Unverified
A Safe Hierarchical Planning Framework for Complex Driving Scenarios based on Reinforcement Learning	Jan 17, 2021	Autonomous Vehiclesreinforcement-learning	—Unverified
Local Navigation and Docking of an Autonomous Robot Mower using Reinforcement Learning and Computer Vision	Jan 15, 2021	Navigateobject-detection	—Unverified
Deep Reinforcement Learning for Haptic Shared Control in Unknown Tasks	Jan 15, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Affordance-based Reinforcement Learning for Urban Driving	Jan 15, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Empirical Evaluation of Supervision Signals for Style Transfer Models	Jan 15, 2021	Machine Translationreinforcement-learning	—Unverified
Stochastic Learning Approach to Binary Optimization for Optimal Design of Experiments	Jan 15, 2021	Experimental DesignReinforcement Learning (RL)	—Unverified
Robusta: Robust AutoML for Feature Selection via Reinforcement Learning	Jan 15, 2021	AutoMLFeature Importance	—Unverified
Reinforcement learning based recommender systems: A survey	Jan 15, 2021	Collaborative FilteringDeep Reinforcement Learning	—Unverified
Continuous Deep Q-Learning with Simulator for Stabilization of Uncertain Discrete-Time Systems	Jan 13, 2021	Q-LearningReinforcement Learning (RL)	CodeCode Available
Learning and Fast Adaptation for Grid Emergency Control via Deep Meta Reinforcement Learning	Jan 13, 2021	Deep Reinforcement LearningMeta Reinforcement Learning	—Unverified
Contrastive Behavioral Similarity Embeddings for Generalization in Reinforcement Learning	Jan 13, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Automated Synthesis of Steady-State Continuous Processes using Reinforcement Learning	Jan 12, 2021	reinforcement-learningReinforcement Learning	—Unverified
Linear Representation Meta-Reinforcement Learning for Instant Adaptation	Jan 12, 2021	continuous-controlContinuous Control	—Unverified
Queue-Learning: A Reinforcement Learning Approach for Providing Quality of Service	Jan 12, 2021	AttributeCloud Computing	—Unverified
Solving Common-Payoff Games with Approximate Policy Iteration	Jan 11, 2021	DecoderDeep Reinforcement Learning	CodeCode Available
Independent Policy Gradient Methods for Competitive Reinforcement Learning	Jan 11, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
First-Order Problem Solving through Neural MCTS based Reinforcement Learning	Jan 11, 2021	reinforcement-learningReinforcement Learning	—Unverified
Deep Interactive Bayesian Reinforcement Learning via Meta-Learning	Jan 11, 2021	Meta-Learningreinforcement-learning	—Unverified
Action Priors for Large Action Spaces in Robotics	Jan 11, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Identifying Decision Points for Safe and Interpretable Reinforcement Learning in Hypotension Treatment	Jan 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning with Function Properties in Mean Reversion Strategies	Jan 9, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available
Robust and Scalable Routing with Multi-Agent Deep Reinforcement Learning for MANETs	Jan 9, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Safe Coupled Deep Q-Learning for Recommendation Systems	Jan 8, 2021	Q-LearningRecommendation Systems	—Unverified
qRRT: Quality-Biased Incremental RRT for Optimal Motion Planning in Non-Holonomic Systems	Jan 7, 2021	Motion PlanningOptimal Motion Planning	—Unverified
CoachNet: An Adversarial Sampling Approach for Reinforcement Learning	Jan 7, 2021	continuous-controlContinuous Control	—Unverified
Coding for Distributed Multi-Agent Reinforcement Learning	Jan 7, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
An Adaptive Multi-Agent Physical Layer Security Framework for Cognitive Cyber-Physical Systems	Jan 7, 2021	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 193 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified