Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9876–9900 of 15113 papers

Title	Date	Tasks	Status
Learn to Play Tetris with Deep Reinforcement Learning	Dec 14, 2020	Deep Reinforcement LearningImitation Learning	—Unverified
Learn To Manage Portfolio With Reinforcement Learning	Dec 14, 2020	Managementreinforcement-learning	—Unverified
IPM Move Planner: AN EFFICIENT EXPLOITING DEEP REINFORCEMENT LEARNING WITH MONTE CARLO TREE SEARCH	Dec 14, 2020	BlockingDeep Reinforcement Learning	—Unverified
Automatic Source Code Summarization via Reinforcement Learning	Dec 14, 2020	Cloud ComputingCode Summarization	—Unverified
Increasing Data Efficiency of Driving Agent By World Model	Dec 14, 2020	Autonomous Drivingreinforcement-learning	CodeCode Available
A case for new neural network smoothness constraints	Dec 14, 2020	Adversarial RobustnessBIG-bench Machine Learning	—Unverified
Learning Visual Robotic Control Efficiently with Contrastive Pre-training and Data Augmentation	Dec 14, 2020	Data Augmentationreinforcement-learning	—Unverified
Learning Mobile Robot Navigation in the Dense Crowd with Deep Reinforcement Learning	Dec 14, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Reinforcement Learning with Subspaces using Free Energy Paradigm	Dec 13, 2020	reinforcement-learningReinforcement Learning	—Unverified
Tutoring Reinforcement Learning via Feedback Control	Dec 12, 2020	reinforcement-learningReinforcement Learning	—Unverified
Noise-Robust End-to-End Quantum Control using Deep Autoregressive Policy Networks	Dec 12, 2020	reinforcement-learningReinforcement Learning	—Unverified
Semi-supervised reward learning for offline reinforcement learning	Dec 12, 2020	Behavioural cloningreinforcement-learning	—Unverified
OPAC: Opportunistic Actor-Critic	Dec 11, 2020	continuous-controlContinuous Control	—Unverified
Regularizing Action Policies for Smooth Control with Reinforcement Learning	Dec 11, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning Agents for Ubisoft's Roller Champions	Dec 10, 2020	Cultural Vocal Bursts Intensity Predictionreinforcement-learning	—Unverified
Performance-Weighed Policy Sampling for Meta-Reinforcement Learning	Dec 10, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified
Blending MPC & Value Function Approximation for Efficient Reinforcement Learning	Dec 10, 2020	Model Predictive Controlreinforcement-learning	—Unverified
Flatland-RL : Multi-Agent Reinforcement Learning on Trains	Dec 10, 2020	Imitation LearningMulti-agent Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Stock Portfolio Optimization	Dec 9, 2020	Deep Reinforcement LearningPortfolio Optimization	—Unverified
A Deep Reinforcement Learning Approach for Ramp Metering Based on Traffic Video Data	Dec 9, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning for Long Term Hydropower Production Scheduling	Dec 9, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Interactive Search Based on Deep Reinforcement Learning	Dec 9, 2020	ClusteringDecision Making	—Unverified
Robust Domain Randomised Reinforcement Learning through Peer-to-Peer Distillation	Dec 9, 2020	continuous-controlContinuous Control	—Unverified
Transfer Learning for Efficient Iterative Safety Validation	Dec 9, 2020	Autonomous Drivingreinforcement-learning	—Unverified
MLComp: A Methodology for Machine Learning-based Performance Estimation and Adaptive Selection of Pareto-Optimal Compiler Optimization Sequences	Dec 9, 2020	Compiler Optimizationreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 396 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified