Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8801–8850 of 15113 papers

Title	Date	Tasks	Status	Hype
Deep Reinforcement Learning for Portfolio Optimization using Latent Feature State Space (LFSS) Module	Feb 11, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Combinatorial Optimization: Covering Salesman Problems	Feb 11, 2021	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified	0
Hedging of Financial Derivative Contracts via Monte Carlo Tree Search	Feb 11, 2021	Q-Learningreinforcement-learning	—Unverified	0
Representation Matters: Offline Pretraining for Sequential Decision Making	Feb 11, 2021	Decision MakingImitation Learning	—Unverified	0
Multi-Task Reinforcement Learning with Context-based Representations	Feb 11, 2021	Multi-Task Learningreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning with Symmetric Prior for Predictive Power Allocation to Mobile Users	Feb 10, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Leveraging Reinforcement Learning for evaluating Robustness of KNN Search Algorithms	Feb 10, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Domain Adaptation In Reinforcement Learning Via Latent Unified State Representation	Feb 10, 2021	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available	1
Improving Model-Based Reinforcement Learning with Internal State Representations through Self-Supervision	Feb 10, 2021	Board GamesModel-based Reinforcement Learning	CodeCode Available	1
Derivative-Free Reinforcement Learning: A Review	Feb 10, 2021	Model Selectionreinforcement-learning	—Unverified	0
Learning Equational Theorem Proving	Feb 10, 2021	Automated Theorem ProvingDeep Reinforcement Learning	—Unverified	0
Defense Against Reward Poisoning Attacks in Reinforcement Learning	Feb 10, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Modeling the Interaction between Agents in Cooperative Multi-Agent Reinforcement Learning	Feb 10, 2021	continuous-controlContinuous Control	—Unverified	0
Personalization for Web-based Services using Offline Reinforcement Learning	Feb 10, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Policy Augmentation: An Exploration Strategy for Faster Convergence of Deep Reinforcement Learning Algorithms	Feb 10, 2021	Deep Reinforcement LearningMatrix Completion	CodeCode Available	0
Risk-Averse Offline Reinforcement Learning	Feb 10, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Simple Agent, Complex Environment: Efficient Reinforcement Learning with Agent States	Feb 10, 2021	Q-Learningreinforcement-learning	—Unverified	0
Reinforcement Learning for Optimized Beam Training in Multi-Hop Terahertz Communications	Feb 10, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Patterns, predictions, and actions: A story about machine learning	Feb 10, 2021	BIG-bench Machine LearningCausal Inference	—Unverified	0
Non-stationary Reinforcement Learning without Prior Knowledge: An Optimal Black-box Approach	Feb 10, 2021	Multi-Armed Banditsreinforcement-learning	—Unverified	0
Risk-Averse Bayes-Adaptive Reinforcement Learning	Feb 10, 2021	Bayesian Optimisationreinforcement-learning	—Unverified	0
Scheduling the NASA Deep Space Network with Deep Reinforcement Learning	Feb 9, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Adaptive Pairwise Weights for Temporal Credit Assignment	Feb 9, 2021	Reinforcement Learning (RL)	—Unverified	0
Measuring Progress in Deep Reinforcement Learning Sample Efficiency	Feb 9, 2021	Atari Gamescontinuous-control	—Unverified	0
rl_reach: Reproducible Reinforcement Learning Experiments for Robotic Reaching Tasks	Feb 9, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Reverb: A Framework For Experience Replay	Feb 9, 2021	Reinforcement Learning (RL)	CodeCode Available	1
Continuous-Time Model-Based Reinforcement Learning	Feb 9, 2021	modelModel-based Reinforcement Learning	CodeCode Available	1
Learning State Representations from Random Deep Action-conditional Predictions	Feb 9, 2021	Atari GamesReinforcement Learning (RL)	CodeCode Available	0
Contrasting Centralized and Decentralized Critics in Multi-Agent Reinforcement Learning	Feb 8, 2021	MisconceptionsMulti-agent Reinforcement Learning	—Unverified	0
Introduction to Machine Learning for the Sciences	Feb 8, 2021	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Grid-to-Graph: Flexible Spatial Relational Inductive Biases for Reinforcement Learning	Feb 8, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Generate and Revise: Reinforcement Learning in Neural Poetry	Feb 8, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Optimal Strategies for Temporal Tasks in Stochastic Games	Feb 8, 2021	Reinforcement Learning (RL)	—Unverified	0
Provable Model-based Nonlinear Bandit and Reinforcement Learning: Shelve Optimism, Embrace Virtual Curvature	Feb 8, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Neurogenetic Programming Framework for Explainable Reinforcement Learning	Feb 8, 2021	OpenAI Gymreinforcement-learning	CodeCode Available	0
RL-Scope: Cross-Stack Profiling for Deep Reinforcement Learning Workloads	Feb 8, 2021	CPUDeep Reinforcement Learning	CodeCode Available	1
Unlocking Pixels for Reinforcement Learning via Implicit Attention	Feb 8, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Sparsely ensembled convolutional neural network classifiers via reinforcement learning	Feb 7, 2021	Ensemble Learningreinforcement-learning	CodeCode Available	0
An Analysis of Frame-skipping in Reinforcement Learning	Feb 7, 2021	Decision Makingreinforcement-learning	—Unverified	0
Tactical Optimism and Pessimism for Deep Reinforcement Learning	Feb 7, 2021	continuous-controlContinuous Control	CodeCode Available	1
Multi-Agent Deep Reinforcement Learning for Request Dispatching in Distributed-Controller Software-Defined Networking	Feb 6, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
LongiControl: A Reinforcement Learning Environment for Longitudinal Vehicle Control	Feb 6, 2021	Autonomous DrivingOpenAI Gym	CodeCode Available	1
Explainable Reinforcement Learning for Longitudinal Control	Feb 6, 2021	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	1
A Hybrid Approach for Reinforcement Learning Using Virtual Policy Gradient for Balancing an Inverted Pendulum	Feb 6, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
MSPM: A Modularized and Scalable Multi-Agent Reinforcement Learning-based System for Financial Portfolio Management	Feb 6, 2021	Decision MakingManagement	—Unverified	0
Rethinking the Implementation Matters in Cooperative Multi-Agent Reinforcement Learning	Feb 6, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Improving Model and Search for Computer Go	Feb 6, 2021	Deep Reinforcement Learningmodel	—Unverified	0
A bandit approach to curriculum generation for automatic speech recognition	Feb 6, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Addressing Inherent Uncertainty: Risk-Sensitive Behavior Generation for Automated Driving using Distributional Reinforcement Learning	Feb 5, 2021	Distributional Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Topology-Aware Network Pruning using Multi-stage Graph Embedding and Reinforcement Learning	Feb 5, 2021	Graph EmbeddingModel Compression	CodeCode Available	1

Show:10 25 50

← PrevPage 177 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified