Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12101–12150 of 15113 papers

Title	Date	Tasks	Status
Multi-task Learning and Catastrophic Forgetting in Continual Reinforcement Learning	Sep 22, 2019	Continual LearningDeep Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning with Modulated Hebbian plus Q Network Architecture	Sep 21, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Leveraging Human Guidance for Deep Reinforcement Learning Tasks	Sep 21, 2019	Deep Reinforcement LearningImitation Learning	—Unverified
Bayesian Optimization for Iterative Learning	Sep 20, 2019	Bayesian OptimizationDeep Reinforcement Learning	CodeCode Available
A Layered Architecture for Active Perception: Image Classification using Deep Reinforcement Learning	Sep 20, 2019	Deep Reinforcement LearningGeneral Classification	—Unverified
How Much Do Unstated Problem Constraints Limit Deep Robotic Reinforcement Learning?	Sep 20, 2019	continuous-controlContinuous Control	—Unverified
Redirection Controller Using Reinforcement Learning	Sep 20, 2019	reinforcement-learningReinforcement Learning	—Unverified
On the Convergence of Approximate and Regularized Policy Iteration Schemes	Sep 20, 2019	Q-LearningReinforcement Learning	—Unverified
Meta-Inverse Reinforcement Learning with Probabilistic Context Variables	Sep 20, 2019	continuous-controlContinuous Control	CodeCode Available
Robot Sound Interpretation: Combining Sight and Sound in Learning-Based Control	Sep 19, 2019	Decision Makingreinforcement-learning	—Unverified
Instance-dependent _-bounds for policy evaluation in tabular reinforcement learning	Sep 19, 2019	reinforcement-learningReinforcement Learning	—Unverified
MACS: Deep Reinforcement Learning based SDN Controller Synchronization Policy Design	Sep 19, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Robust Opponent Modeling via Adversarial Ensemble Reinforcement Learning in Asymmetric Imperfect-Information Games	Sep 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
Visual Tracking by means of Deep Reinforcement Learning and an Expert Demonstrator	Sep 18, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Segregation Dynamics with Reinforcement Learning and Agent Based Modeling	Sep 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
Sample Efficient Policy Gradient Methods with Recursive Variance Reduction	Sep 18, 2019	Policy Gradient Methodsreinforcement-learning	CodeCode Available
Automated Lane Change Decision Making using Deep Reinforcement Learning in Dynamic and Uncertain Highway Environment	Sep 18, 2019	Autonomous DrivingDecision Making	—Unverified
Dependency-Aware Computation Offloading in Mobile Edge Computing: A Reinforcement Learning Approach	Sep 18, 2019	Cloud ComputingEdge-computing	—Unverified
A Hierarchical Two-tier Approach to Hyper-parameter Optimization in Reinforcement Learning	Sep 18, 2019	Bayesian Optimizationreinforcement-learning	—Unverified
DeepGait: Planning and Control of Quadrupedal Gaits using Deep Reinforcement Learning	Sep 18, 2019	Deep Reinforcement LearningMotion Planning	—Unverified
A Human-Centered Data-Driven Planner-Actor-Critic Architecture via Logic Programming	Sep 18, 2019	General KnowledgeReinforcement Learning	—Unverified
Controllable Length Control Neural Encoder-Decoder via Reinforcement Learning	Sep 17, 2019	Decoderreinforcement-learning	—Unverified
A Review of Tracking, Prediction and Decision Making Methods for Autonomous Driving	Sep 17, 2019	Autonomous DrivingDecision Making	—Unverified
Hierarchical Reinforcement Learning for Open-Domain Dialog	Sep 17, 2019	Hierarchical Reinforcement LearningOpen-Domain Dialog	—Unverified
Attraction-Repulsion Actor-Critic for Continuous Control Reinforcement Learning	Sep 17, 2019	continuous-controlContinuous Control	—Unverified
Adversarial Feature Training for Generalizable Robotic Visuomotor Control	Sep 17, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified
Generating Black-Box Adversarial Examples for Text Classifiers Using a Deep Reinforced Model	Sep 17, 2019	reinforcement-learningReinforcement Learning	—Unverified
Stock market microstructure inference via multi-agent reinforcement learning	Sep 17, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
MDP Playground: An Analysis and Debug Testbed for Reinforcement Learning	Sep 17, 2019	MuJoCoOpenAI Gym	CodeCode Available
Off-road Autonomous Vehicles Traversability Analysis and Trajectory Planning Based on Deep Inverse Reinforcement Learning	Sep 16, 2019	Autonomous Vehiclesreinforcement-learning	—Unverified
Meta Reinforcement Learning for Sim-to-real Domain Adaptation	Sep 16, 2019	Domain AdaptationMeta-Learning	—Unverified
Leveraging human Domain Knowledge to model an empirical Reward function for a Reinforcement Learning problem	Sep 16, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Data Centers Job Scheduling with Deep Reinforcement Learning	Sep 16, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Control Synthesis from Linear Temporal Logic Specifications using Model-Free Reinforcement Learning	Sep 16, 2019	Motion Planningreinforcement-learning	CodeCode Available
Selective Network Discovery via Deep Reinforcement Learning on Embedded Spaces	Sep 16, 2019	AttributeDecision Making	—Unverified
Driving in Dense Traffic with Model-Free Reinforcement Learning	Sep 15, 2019	continuous-controlContinuous Control	CodeCode Available
Policy Prediction Network: Model-Free Behavior Policy with Model-Based Learning in Continuous Action Space	Sep 15, 2019	continuous-controlContinuous Control	—Unverified
State Representation Learning from Demonstration	Sep 15, 2019	Imitation LearningReinforcement Learning	—Unverified
Wield: Systematic Reinforcement Learning With Progressive Randomization	Sep 15, 2019	General Classificationreinforcement-learning	—Unverified
Model Based Planning with Energy Based Models	Sep 15, 2019	modelReinforcement Learning	—Unverified
Node Injection Attacks on Graphs via Reinforcement Learning	Sep 14, 2019	Node Classificationreinforcement-learning	—Unverified
Flight Controller Synthesis Via Deep Reinforcement Learning	Sep 14, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Learning to Recover Sparse Signals	Sep 14, 2019	compressed sensingreinforcement-learning	—Unverified
Active Learning for Risk-Sensitive Inverse Reinforcement Learning	Sep 14, 2019	Active Learningreinforcement-learning	—Unverified
HJB Optimal Feedback Control with Deep Differential Value Functions and Action Constraints	Sep 13, 2019	reinforcement-learningReinforcement Learning	—Unverified
DL2: A Deep Learning-driven Scheduler for Deep Learning Clusters	Sep 13, 2019	Deep LearningFairness	CodeCode Available
AITuning: Machine Learning-based Tuning Tool for Run-Time Communication Libraries	Sep 13, 2019	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Petri Net Machines for Human-Agent Interaction	Sep 13, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified
Reinforcement Learning: a Comparison of UCB Versus Alternative Adaptive Policies	Sep 13, 2019	reinforcement-learningReinforcement Learning	—Unverified
Say What I Want: Towards the Dark Side of Neural Dialogue Models	Sep 13, 2019	ChatbotReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 243 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified