Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8951–8975 of 15113 papers

Title	Date	Tasks	Status
Multi-Objective SPIBB: Seldonian Offline Policy Improvement with Safety Constraints in Finite MDPs	May 31, 2021	Reinforcement Learning (RL)	—Unverified
Tesseract: Tensorised Actors for Multi-Agent Reinforcement Learning	May 31, 2021	Learning TheoryMulti-agent Reinforcement Learning	—Unverified
Deep Reinforcement Learning in Quantitative Algorithmic Trading: A Review	May 31, 2021	Algorithmic TradingDeep Reinforcement Learning	CodeCode Available
AppBuddy: Learning to Accomplish Tasks in Mobile Apps via Reinforcement Learning	May 31, 2021	OpenAI Gymreinforcement-learning	—Unverified
Reducing the Deployment-Time Inference Control Costs of Deep Reinforcement Learning Agents via an Asymmetric Architecture	May 30, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Shaped Policy Search for Evolutionary Strategies using Waypoints	May 30, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
On the Theory of Reinforcement Learning with Once-per-Episode Feedback	May 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Predictive Representation Learning for Language Modeling	May 29, 2021	Language ModelingLanguage Modelling	—Unverified
Gradient-Free Neural Network Training via Synaptic-Level Reinforcement Learning	May 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
A Survey of Deep Reinforcement Learning Algorithms for Motion Planning and Control of Autonomous Vehicles	May 29, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified
Joint Optimization of Multi-Objective Reinforcement Learning with Policy Gradient Based Algorithm	May 28, 2021	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified
Reconfigurable Intelligent Surface-assisted Multi-UAV Networks: Efficient Resource Allocation with Deep Reinforcement Learning	May 28, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Learning Approximate and Exact Numeral Systems via Reinforcement Learning	May 28, 2021	reinforcement-learningReinforcement Learning	—Unverified
A nearly Blackwell-optimal policy gradient method	May 28, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Sample-Efficient Reinforcement Learning for Linearly-Parameterized MDPs with a Generative Model	May 28, 2021	Q-Learningreinforcement-learning	—Unverified
Risk-Aware Transfer in Reinforcement Learning using Successor Features	May 28, 2021	Decision Makingreinforcement-learning	—Unverified
Task-Guided Inverse Reinforcement Learning Under Partial Information	May 28, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning reveals fundamental limits on the mixing of active particles	May 28, 2021	Open-Ended Question Answeringreinforcement-learning	—Unverified
Transferable Deep Reinforcement Learning Framework for Autonomous Vehicles with Joint Radar-Data Communications	May 28, 2021	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
Stochastic Intervention for Causal Inference via Reinforcement Learning	May 28, 2021	Causal InferenceDecision Making	—Unverified
Reinforcement Learning for on-line Sequence Transformation	May 28, 2021	Machine Translationreinforcement-learning	—Unverified
Optimistic Reinforcement Learning by Forward Kullback-Leibler Divergence Optimization	May 27, 2021	reinforcement-learningReinforcement Learning	—Unverified
Pattern Transfer Learning for Reinforcement Learning in Order Dispatching	May 27, 2021	reinforcement-learningReinforcement Learning	—Unverified
Branching Dueling Q-Network Based Online Scheduling of a Microgrid With Distributed Energy Storage Systems	May 27, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adversarial Intrinsic Motivation for Reinforcement Learning	May 27, 2021	Multi-Goal Reinforcement Learningreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 359 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified