Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9501–9550 of 15113 papers

Title	Date	Tasks	Status
Deep Reinforcement Learning for Backup Strategies against Adversaries	Feb 12, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Discovery of Options via Meta-Learned Subgoals	Feb 12, 2021	Reinforcement Learning (RL)	—Unverified
Disturbing Reinforcement Learning Agents with Corrupted Rewards	Feb 12, 2021	Autonomous Drivingreinforcement-learning	—Unverified
Hedging of Financial Derivative Contracts via Monte Carlo Tree Search	Feb 11, 2021	Q-Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning for Portfolio Optimization using Latent Feature State Space (LFSS) Module	Feb 11, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Combinatorial Optimization: Covering Salesman Problems	Feb 11, 2021	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Representation Matters: Offline Pretraining for Sequential Decision Making	Feb 11, 2021	Decision MakingImitation Learning	—Unverified
Risk-Averse Bayes-Adaptive Reinforcement Learning	Feb 10, 2021	Bayesian Optimisationreinforcement-learning	—Unverified
Reinforcement Learning for Optimized Beam Training in Multi-Hop Terahertz Communications	Feb 10, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Non-stationary Reinforcement Learning without Prior Knowledge: An Optimal Black-box Approach	Feb 10, 2021	Multi-Armed Banditsreinforcement-learning	—Unverified
Simple Agent, Complex Environment: Efficient Reinforcement Learning with Agent States	Feb 10, 2021	Q-Learningreinforcement-learning	—Unverified
Patterns, predictions, and actions: A story about machine learning	Feb 10, 2021	BIG-bench Machine LearningCausal Inference	—Unverified
Modeling the Interaction between Agents in Cooperative Multi-Agent Reinforcement Learning	Feb 10, 2021	continuous-controlContinuous Control	—Unverified
Policy Augmentation: An Exploration Strategy for Faster Convergence of Deep Reinforcement Learning Algorithms	Feb 10, 2021	Deep Reinforcement LearningMatrix Completion	CodeCode Available
Personalization for Web-based Services using Offline Reinforcement Learning	Feb 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
Derivative-Free Reinforcement Learning: A Review	Feb 10, 2021	Model Selectionreinforcement-learning	—Unverified
Defense Against Reward Poisoning Attacks in Reinforcement Learning	Feb 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
Leveraging Reinforcement Learning for evaluating Robustness of KNN Search Algorithms	Feb 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learning Equational Theorem Proving	Feb 10, 2021	Automated Theorem ProvingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning with Symmetric Prior for Predictive Power Allocation to Mobile Users	Feb 10, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Learning State Representations from Random Deep Action-conditional Predictions	Feb 9, 2021	Atari GamesReinforcement Learning (RL)	CodeCode Available
Adaptive Pairwise Weights for Temporal Credit Assignment	Feb 9, 2021	Reinforcement Learning (RL)	—Unverified
Scheduling the NASA Deep Space Network with Deep Reinforcement Learning	Feb 9, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Measuring Progress in Deep Reinforcement Learning Sample Efficiency	Feb 9, 2021	Atari Gamescontinuous-control	—Unverified
Provable Model-based Nonlinear Bandit and Reinforcement Learning: Shelve Optimism, Embrace Virtual Curvature	Feb 8, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Unlocking Pixels for Reinforcement Learning via Implicit Attention	Feb 8, 2021	reinforcement-learningReinforcement Learning	—Unverified
Neurogenetic Programming Framework for Explainable Reinforcement Learning	Feb 8, 2021	OpenAI Gymreinforcement-learning	CodeCode Available
Generate and Revise: Reinforcement Learning in Neural Poetry	Feb 8, 2021	reinforcement-learningReinforcement Learning	—Unverified
Contrasting Centralized and Decentralized Critics in Multi-Agent Reinforcement Learning	Feb 8, 2021	MisconceptionsMulti-agent Reinforcement Learning	—Unverified
Introduction to Machine Learning for the Sciences	Feb 8, 2021	BIG-bench Machine Learningreinforcement-learning	—Unverified
Learning Optimal Strategies for Temporal Tasks in Stochastic Games	Feb 8, 2021	Reinforcement Learning (RL)	—Unverified
An Analysis of Frame-skipping in Reinforcement Learning	Feb 7, 2021	Decision Makingreinforcement-learning	—Unverified
Sparsely ensembled convolutional neural network classifiers via reinforcement learning	Feb 7, 2021	Ensemble Learningreinforcement-learning	CodeCode Available
Multi-Agent Deep Reinforcement Learning for Request Dispatching in Distributed-Controller Software-Defined Networking	Feb 6, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
A bandit approach to curriculum generation for automatic speech recognition	Feb 6, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Model and Search for Computer Go	Feb 6, 2021	Deep Reinforcement Learningmodel	—Unverified
MSPM: A Modularized and Scalable Multi-Agent Reinforcement Learning-based System for Financial Portfolio Management	Feb 6, 2021	Decision MakingManagement	—Unverified
A Hybrid Approach for Reinforcement Learning Using Virtual Policy Gradient for Balancing an Inverted Pendulum	Feb 6, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Finite Sample Analysis of Minimax Offline Reinforcement Learning: Completeness, Fast Rates and First-Order Efficiency	Feb 5, 2021	Off-policy evaluationreinforcement-learning	—Unverified
Experience-Based Heuristic Search: Robust Motion Planning with Deep Q-Learning	Feb 5, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified
Deceptive Reinforcement Learning for Privacy-Preserving Planning	Feb 5, 2021	Privacy Preservingreinforcement-learning	—Unverified
Addressing Inherent Uncertainty: Risk-Sensitive Behavior Generation for Automated Driving using Distributional Reinforcement Learning	Feb 5, 2021	Distributional Reinforcement LearningReinforcement Learning (RL)	—Unverified
Deep reinforcement learning for smart calibration of radio telescopes	Feb 5, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Revisiting Prioritized Experience Replay: A Value Perspective	Feb 5, 2021	Atari GamesQ-Learning	CodeCode Available
Provably Efficient Algorithms for Multi-Objective Competitive RL	Feb 5, 2021	Multi-Objective Reinforcement LearningReinforcement Learning (RL)	—Unverified
Persistent Rule-based Interactive Reinforcement Learning	Feb 4, 2021	reinforcement-learningReinforcement Learning	—Unverified
Hybrid Adversarial Imitation Learning	Feb 4, 2021	Imitation LearningReinforcement Learning (RL)	—Unverified
A review of motion planning algorithms for intelligent robotics	Feb 4, 2021	Motion PlanningQ-Learning	—Unverified
Deep reinforcement learning-based image classification achieves perfect testing set accuracy for MRI brain tumors with a training set of only 30 images	Feb 4, 2021	ClassificationDeep Reinforcement Learning	—Unverified
How to Train Your Robot with Deep Reinforcement Learning; Lessons We've Learned	Feb 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 191 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified