Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10351–10375 of 15113 papers

Title	Date	Tasks	Status
Reinforcement Learning-based N-ary Cross-Sentence Relation Extraction	Sep 26, 2020	reinforcement-learningReinforcement Learning	—Unverified
Lineage Evolution Reinforcement Learning	Sep 26, 2020	reinforcement-learningReinforcement Learning	—Unverified
Complementary Meta-Reinforcement Learning for Fault-Adaptive Control	Sep 26, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified
Graph neural induction of value iteration	Sep 26, 2020	Deep Reinforcement LearningGraph Neural Network	—Unverified
Inverse Rational Control with Partially Observable Continuous Nonlinear Dynamics	Sep 26, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Bootstrapped Q-learning with Context Relevant Observation Pruning to Generalize in Text-based Games	Sep 24, 2020	Q-LearningReinforcement Learning (RL)	CodeCode Available
Motion Planning by Reinforcement Learning for an Unmanned Aerial Vehicle in Virtual Open Space with Static Obstacles	Sep 24, 2020	Motion Planningreinforcement-learning	—Unverified
Sim-to-Real Transfer in Deep Reinforcement Learning for Robotics: a Survey	Sep 24, 2020	Deep Reinforcement LearningDomain Adaptation	—Unverified
ReLeaSER: A Reinforcement Learning Strategy for Optimizing Utilization Of Ephemeral Cloud Resources	Sep 23, 2020	CPUreinforcement-learning	—Unverified
Probabilistic Machine Learning for Healthcare	Sep 23, 2020	BIG-bench Machine Learningreinforcement-learning	—Unverified
Robust Reinforcement Learning-based Autonomous Driving Agent for Simulation and Real World	Sep 23, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
What is the Reward for Handwriting? -- Handwriting Generation by Imitation Learning	Sep 23, 2020	Handwriting generationImitation Learning	—Unverified
Demand Responsive Dynamic Pricing Framework for Prosumer Dominated Microgrids using Multiagent Reinforcement Learning	Sep 23, 2020	Decision Makingreinforcement-learning	—Unverified
A Multi-Agent Deep Reinforcement Learning Approach for a Distributed Energy Marketplace in Smart Grids	Sep 23, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Is Q-Learning Provably Efficient? An Extended Analysis	Sep 22, 2020	Q-Learningreinforcement-learning	—Unverified
A Centralised Soft Actor Critic Deep Reinforcement Learning Approach to District Demand Side Management through CityLearn	Sep 22, 2020	Deep Reinforcement LearningManagement	CodeCode Available
Distributed Structured Actor-Critic Reinforcement Learning for Universal Dialogue Management	Sep 22, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for On-line Dialogue State Tracking	Sep 22, 2020	Deep Reinforcement LearningDialogue Management	—Unverified
SUMBT+LaRL: Effective Multi-domain End-to-end Neural Task-oriented Dialog System	Sep 22, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning Approaches in Social Robotics	Sep 21, 2020	Decision Makingreinforcement-learning	—Unverified
Mobile Cellular-Connected UAVs: Reinforcement Learning for Sky Limits	Sep 21, 2020	reinforcement-learningReinforcement Learning	—Unverified
Rethinking Supervised Learning and Reinforcement Learning in Task-Oriented Dialogue Systems	Sep 21, 2020	DecoderMulti-Label Classification	CodeCode Available
Deep Reinforcement Learning Methods for Structure-Guided Processing Path Optimization	Sep 21, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Dynamic Horizon Value Estimation for Model-based Reinforcement Learning	Sep 21, 2020	Model-based Reinforcement LearningNovelty Detection	—Unverified
Human Engagement Providing Evaluative and Informative Advice for Interactive Reinforcement Learning	Sep 21, 2020	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 415 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified