Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10951–11000 of 15113 papers

Title	Date	Tasks	Status	Hype
SQUIRL: Robust and Efficient Learning from Video Demonstration of Long-Horizon Robotic Manipulation Tasks	Mar 10, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Exploring Unknown States with Action Balance	Mar 10, 2020	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Explore and Exploit with Heterotic Line Bundle Models	Mar 10, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Curriculum Learning for Reinforcement Learning Domains: A Framework and Survey	Mar 10, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Automatic Curriculum Learning For Deep RL: A Short Survey	Mar 10, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Advancing Renewable Electricity Consumption With Reinforcement Learning	Mar 9, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Transfer Reinforcement Learning under Unobserved Contextual Information	Mar 9, 2020	Motion PlanningQ-Learning	—Unverified	0
Zooming for Efficient Model-Free Reinforcement Learning in Metric Spaces	Mar 9, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Stable Policy Optimization via Off-Policy Divergence Regularization	Mar 9, 2020	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	0
Q* Approximation Schemes for Batch Reinforcement Learning: A Theoretical Comparison	Mar 9, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Human AI interaction loop training: New approach for interactive reinforcement learning	Mar 9, 2020	Decision MakingImitation Learning	—Unverified	0
Generative Adversarial Imitation Learning with Neural Networks: Global Optimality and Convergence Rate	Mar 8, 2020	Imitation Learningreinforcement-learning	—Unverified	0
Deep Adversarial Reinforcement Learning for Object Disentangling	Mar 8, 2020	Objectreinforcement-learning	—Unverified	0
On the Robustness of Cooperative Multi-Agent Reinforcement Learning	Mar 8, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Reinforcement Learning Based Cooperative Coded Caching under Dynamic Popularities in Ultra-Dense Networks	Mar 8, 2020	Q-LearningReinforcement Learning	—Unverified	0
Reinforcement Learning for Combinatorial Optimization: A Survey	Mar 7, 2020	Combinatorial OptimizationDecision Making	—Unverified	0
Convergence of Q-value in case of Gaussian rewards	Mar 7, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic Signal Control	Mar 6, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Lane-Merging Using Policy-based Reinforcement Learning and Post-Optimization	Mar 6, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Cost-Sensitive Portfolio Selection via Deep Reinforcement Learning	Mar 6, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Smart Train Operation Algorithms based on Expert Knowledge and Reinforcement Learning	Mar 6, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning-BasedRobust Protection in DER-Rich Distribution Grids	Mar 5, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Efficient and Effective Similar Subtrajectory Search with Deep Reinforcement Learning	Mar 5, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Distributional Robustness and Regularization in Reinforcement Learning	Mar 5, 2020	Decision Makingreinforcement-learning	—Unverified	0
Reward Design in Cooperative Multi-agent Reinforcement Learning for Packet Routing	Mar 5, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
A Geometric Perspective on Visual Imitation Learning	Mar 5, 2020	Imitation LearningReinforcement Learning	—Unverified	0
Dynamic Experience Replay	Mar 4, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Privacy-Aware Time-Series Data Sharing with Deep Reinforcement Learning	Mar 4, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Neural-Network Heuristics for Adaptive Bayesian Quantum Estimation	Mar 4, 2020	parameter estimationReinforcement Learning	—Unverified	0
Efficient statistical validation with edge cases to evaluate Highly Automated Vehicles	Mar 4, 2020	Autonomous VehiclesReinforcement Learning	—Unverified	0
Deep Reinforcement Learning for QoS-Constrained Resource Allocation in Multiservice Networks	Mar 3, 2020	Deep Reinforcement LearningDistributed Optimization	—Unverified	0
Embodied Synaptic Plasticity with Online Reinforcement learning	Mar 3, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Efficient Exploration in Constrained Environments with Goal-Oriented Reference Path	Mar 3, 2020	Efficient ExplorationNavigate	—Unverified	0
Contention Window Optimization in IEEE 802.11ax Networks with Deep Reinforcement Learning	Mar 3, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Can Increasing Input Dimensionality Improve Deep Reinforcement Learning?	Mar 3, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Learning Context-aware Task Reasoning for Efficient Meta-reinforcement Learning	Mar 3, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Safe Reinforcement Learning for Autonomous Vehicles through Parallel Constrained Policy Optimization	Mar 3, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Robust Market Making via Adversarial Reinforcement Learning	Mar 3, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Relevance-Guided Modeling of Object Dynamics for Reinforcement Learning	Mar 3, 2020	Atari GamesDeep Reinforcement Learning	—Unverified	0
PPMC RL Training Algorithm: Rough Terrain Intelligent Robots through Reinforcement Learning	Mar 2, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Upper Confidence Primal-Dual Reinforcement Learning for CMDP with Adversarial Loss	Mar 2, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Real-World Human-Robot Collaborative Reinforcement Learning	Mar 2, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Dynamic Queue-Jump Lane for Emergency Vehicles under Partially Connected Settings: A Multi-Agent Deep Reinforcement Learning Approach	Mar 2, 2020	BlockingDeep Reinforcement Learning	—Unverified	0
Scaling Up Multiagent Reinforcement Learning for Robotic Systems: Learn an Adaptive Sparse Communication Graph	Mar 2, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
MVP: Unified Motion and Visual Self-Supervised Learning for Large-Scale Robotic Navigation	Mar 2, 2020	Autonomous DrivingAutonomous Navigation	CodeCode Available	1
Risk-Averse Learning by Temporal Difference Methods	Mar 2, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Adaptive Structural Hyper-Parameter Configuration by Q-Learning	Mar 2, 2020	Evolutionary AlgorithmsQ-Learning	—Unverified	0
Formal Controller Synthesis for Continuous-Space MDPs via Model-Free Reinforcement Learning	Mar 2, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Cluster-Based Social Reinforcement Learning	Mar 2, 2020	ClusteringMarketing	—Unverified	0
Gaussian Process Policy Optimization	Mar 2, 2020	MuJoCoreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 220 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified