Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11226–11250 of 15113 papers

Title	Date	Tasks	Status
Privacy-Cost Management in Smart Meters Using Deep Reinforcement Learning	Mar 10, 2020	Deep Reinforcement LearningManagement	—Unverified
Reinforcement Learning for Mitigating Intermittent Interference in Terahertz Communication Networks	Mar 10, 2020	reinforcement-learningReinforcement Learning	—Unverified
Zooming for Efficient Model-Free Reinforcement Learning in Metric Spaces	Mar 9, 2020	reinforcement-learningReinforcement Learning	—Unverified
Transfer Reinforcement Learning under Unobserved Contextual Information	Mar 9, 2020	Motion PlanningQ-Learning	—Unverified
Q* Approximation Schemes for Batch Reinforcement Learning: A Theoretical Comparison	Mar 9, 2020	reinforcement-learningReinforcement Learning	—Unverified
Stable Policy Optimization via Off-Policy Divergence Regularization	Mar 9, 2020	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Advancing Renewable Electricity Consumption With Reinforcement Learning	Mar 9, 2020	reinforcement-learningReinforcement Learning	—Unverified
Human AI interaction loop training: New approach for interactive reinforcement learning	Mar 9, 2020	Decision MakingImitation Learning	—Unverified
Deep Adversarial Reinforcement Learning for Object Disentangling	Mar 8, 2020	Objectreinforcement-learning	—Unverified
Generative Adversarial Imitation Learning with Neural Networks: Global Optimality and Convergence Rate	Mar 8, 2020	Imitation Learningreinforcement-learning	—Unverified
Reinforcement Learning Based Cooperative Coded Caching under Dynamic Popularities in Ultra-Dense Networks	Mar 8, 2020	Q-LearningReinforcement Learning	—Unverified
Reinforcement Learning for Combinatorial Optimization: A Survey	Mar 7, 2020	Combinatorial OptimizationDecision Making	—Unverified
Convergence of Q-value in case of Gaussian rewards	Mar 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Cost-Sensitive Portfolio Selection via Deep Reinforcement Learning	Mar 6, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Lane-Merging Using Policy-based Reinforcement Learning and Post-Optimization	Mar 6, 2020	reinforcement-learningReinforcement Learning	—Unverified
Smart Train Operation Algorithms based on Expert Knowledge and Reinforcement Learning	Mar 6, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reward Design in Cooperative Multi-agent Reinforcement Learning for Packet Routing	Mar 5, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Distributional Robustness and Regularization in Reinforcement Learning	Mar 5, 2020	Decision Makingreinforcement-learning	—Unverified
Efficient and Effective Similar Subtrajectory Search with Deep Reinforcement Learning	Mar 5, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Geometric Perspective on Visual Imitation Learning	Mar 5, 2020	Imitation LearningReinforcement Learning	—Unverified
Deep Reinforcement Learning-BasedRobust Protection in DER-Rich Distribution Grids	Mar 5, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Dynamic Experience Replay	Mar 4, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Efficient statistical validation with edge cases to evaluate Highly Automated Vehicles	Mar 4, 2020	Autonomous VehiclesReinforcement Learning	—Unverified
Neural-Network Heuristics for Adaptive Bayesian Quantum Estimation	Mar 4, 2020	parameter estimationReinforcement Learning	—Unverified
Privacy-Aware Time-Series Data Sharing with Deep Reinforcement Learning	Mar 4, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 450 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified