Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11051–11075 of 15113 papers

Title	Date	Tasks	Status
Molecular Design in Synthetically Accessible Chemical Space via Deep Reinforcement Learning	Apr 29, 2020	Deep Reinforcement LearningDrug Design	—Unverified
Meta-Reinforcement Learning for Robotic Industrial Insertion Tasks	Apr 29, 2020	FrictionMeta Reinforcement Learning	—Unverified
The Immersion of Directed Multi-graphs in Embedding Fields. Generalisations	Apr 28, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Improving Sample Efficiency and Multi-Agent Communication in RL-based Train Rescheduling	Apr 28, 2020	Policy Gradient Methodsreinforcement-learning	—Unverified
Age-Aware Status Update Control for Energy Harvesting IoT Sensors via Reinforcement Learning	Apr 27, 2020	reinforcement-learningReinforcement Learning	—Unverified
Can We Learn Heuristics For Graphical Model Inference Using Reinforcement Learning?	Apr 27, 2020	Action RecognitionCombinatorial Optimization	—Unverified
Adaptive model selection in photonic reservoir computing by reinforcement learning	Apr 27, 2020	Load ForecastingModel Selection	—Unverified
Evolving Inborn Knowledge For Fast Adaptation in Dynamic POMDP Problems	Apr 27, 2020	Meta Reinforcement LearningMinecraft	CodeCode Available
The Ingredients of Real-World Robotic Reinforcement Learning	Apr 27, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Generalization with Surprise Minimization	Apr 26, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
A State Aggregation Approach for Solving Knapsack Problem with Deep Reinforcement Learning	Apr 25, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Automatic low-bit hybrid quantization of neural networks through meta learning	Apr 24, 2020	Meta-LearningQuantization	—Unverified
PBCS : Efficient Exploration and Exploitation Using a Synergy between Reinforcement Learning and Motion Planning	Apr 24, 2020	continuous-controlContinuous Control	—Unverified
Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning	Apr 23, 2020	continuous-controlContinuous Control	—Unverified
Guiding Robot Exploration in Reinforcement Learning via Automated Planning	Apr 23, 2020	reinforcement-learningReinforcement Learning	—Unverified
Cooperative Perception with Deep Reinforcement Learning for Connected Vehicles	Apr 23, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Learning Dialog Policies from Weak Demonstrations	Apr 23, 2020	Atari GamesDeep Reinforcement Learning	—Unverified
Correct Me If You Can: Learning from Error Corrections and Markings	Apr 23, 2020	Machine Translationreinforcement-learning	CodeCode Available
Flexible and Efficient Long-Range Planning Through Curious Exploration	Apr 22, 2020	Deep Reinforcement LearningImitation Learning	—Unverified
AutoEG: Automated Experience Grafting for Off-Policy Deep Reinforcement Learning	Apr 22, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Mean-Variance Policy Iteration for Risk-Averse Reinforcement Learning	Apr 22, 2020	MuJoCoreinforcement-learning	—Unverified
Sequential Anomaly Detection using Inverse Reinforcement Learning	Apr 22, 2020	Anomaly DetectionDecision Making	—Unverified
Reinforcement Learning to Optimize the Logistics Distribution Routes of Unmanned Aerial Vehicle	Apr 21, 2020	Combinatorial Optimizationreinforcement-learning	—Unverified
SIBRE: Self Improvement Based REwards for Adaptive Feedback in Reinforcement Learning	Apr 21, 2020	reinforcement-learningReinforcement Learning	—Unverified
Never Stop Learning: The Effectiveness of Fine-Tuning in Robotic Reinforcement Learning	Apr 21, 2020	Continual Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 443 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified