Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10651–10675 of 15113 papers

Title	Date	Tasks	Status
Integrating Logical Rules Into Neural Multi-Hop Reasoning for Drug Repurposing	Jul 10, 2020	Link Predictionreinforcement-learning	—Unverified
Representations for Stable Off-Policy Reinforcement Learning	Jul 10, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Pre-trained Word Embeddings for Goal-conditional Transfer Learning in Reinforcement Learning	Jul 10, 2020	Language ModelingLanguage Modelling	—Unverified
MAPS: Multi-agent Reinforcement Learning-based Portfolio Management System	Jul 10, 2020	ManagementMulti-agent Reinforcement Learning	—Unverified
Vizarel: A System to Help Better Understand RL Agents	Jul 10, 2020	reinforcement-learningReinforcement Learning	—Unverified
Weakness Analysis of Cyberspace Configuration Based on Reinforcement Learning	Jul 9, 2020	reinforcement-learningReinforcement Learning	—Unverified
On the Reliability and Generalizability of Brain-inspired Reinforcement Learning Algorithms	Jul 9, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Learning Retrospective Knowledge with Reverse Reinforcement Learning	Jul 9, 2020	Anomaly Detectionreinforcement-learning	—Unverified
Fast reinforcement learning with generalized policy updates	Jul 9, 2020	Decision MakingProblem Decomposition	—Unverified
A Kernel-Based Approach to Non-Stationary Reinforcement Learning in Metric Spaces	Jul 9, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Attention or memory? Neurointerpretable agents in space and time	Jul 9, 2020	Atari GamesDimensionality Reduction	—Unverified
Low Dose CT Denoising via Joint Bilateral Filtering and Intelligent Parameter Optimization	Jul 9, 2020	Deep LearningDeep Reinforcement Learning	—Unverified
Learning to Prune Deep Neural Networks via Reinforcement Learning	Jul 9, 2020	Deep Reinforcement LearningModel Compression	—Unverified
EVO-RL: Evolutionary-Driven Reinforcement Learning	Jul 9, 2020	OpenAI Gymreinforcement-learning	—Unverified
A Natural Actor-Critic Algorithm with Downside Risk Constraints	Jul 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Discourse Coherence, Reference Grounding and Goal Oriented Dialogue	Jul 8, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Auto-MAP: A DQN Framework for Exploring Distributed Execution Plans for DNN Workloads	Jul 8, 2020	Deep LearningEfficient Exploration	—Unverified
Responsive Safety in Reinforcement Learning by PID Lagrangian Methods	Jul 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Near-Optimal Provable Uniform Convergence in Offline Policy Evaluation for Reinforcement Learning	Jul 7, 2020	Offline RLreinforcement-learning	—Unverified
Towards a practical measure of interference for reinforcement learning	Jul 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Predictive Maintenance for Edge-Based Sensor Networks: A Deep Reinforcement Learning Approach	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Sharp Analysis of Smoothed Bellman Error Embedding	Jul 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
The LoCA Regret: A Consistent Metric to Evaluate Model-Based Behavior in Reinforcement Learning	Jul 7, 2020	General Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available
Necessary and Sufficient Conditions for Inverse Reinforcement Learning of Bayesian Stopping Time Problems	Jul 7, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
A deep reinforcement learning model based on deterministic policy gradient for collective neural crest cell migration	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 427 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified