Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12001–12050 of 15113 papers

Title	Date	Tasks	Status
Q-Learning Based Aerial Base Station Placement for Fairness Enhancement in Mobile Networks	Sep 10, 2019	FairnessQ-Learning	—Unverified
MAT: Multi-Fingered Adaptive Tactile Grasping via Deep Reinforcement Learning	Sep 10, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Transfer of Temporal Logic Formulas in Reinforcement Learning	Sep 10, 2019	reinforcement-learningReinforcement Learning	—Unverified
Signal Instructed Coordination in Cooperative Multi-agent Reinforcement Learning	Sep 10, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning and Video Games	Sep 10, 2019	Atari GamesDeep Learning	—Unverified
Sampling Strategies for GAN Synthetic Data	Sep 10, 2019	AttributeDiversity	—Unverified
Learning Transferable Domain Priors for Safe Exploration in Reinforcement Learning	Sep 10, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning Algorithm for Dynamic Pricing of Express Lanes with Multiple Access Locations	Sep 10, 2019	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Discovery of Useful Questions as Auxiliary Tasks	Sep 10, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Exploratory Combinatorial Optimization with Reinforcement Learning	Sep 9, 2019	Combinatorial Optimizationreinforcement-learning	CodeCode Available
AC-Teach: A Bayesian Actor-Critic Method for Policy Learning with an Ensemble of Suboptimal Teachers	Sep 9, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Recommendation System-based Upper Confidence Bound for Online Advertising	Sep 9, 2019	OpenAI GymProduct Recommendation	—Unverified
Option Encoder: A Framework for Discovering a Policy Basis in Reinforcement Learning	Sep 9, 2019	reinforcement-learningReinforcement Learning	—Unverified
Neural Architecture Search in Embedding Space	Sep 9, 2019	GPUimage-classification	—Unverified
Off-Policy Evaluation in Partially Observable Environments	Sep 9, 2019	Off-policy evaluationReinforcement Learning	—Unverified
Solving Continual Combinatorial Selection via Deep Reinforcement Learning	Sep 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Partner Approximating Learners (PAL): Simulation-Accelerated Learning with Explicit Partner Modeling in Multi-Agent Domains	Sep 9, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Survey on Reproducibility by Evaluating Deep Reinforcement Learning Algorithms on Real-World Robots	Sep 9, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Clickbait? Sensational Headline Generation with Auto-tuned Reinforcement Learning	Sep 9, 2019	Headline Generationreinforcement-learning	CodeCode Available
Fixed-Horizon Temporal Difference Methods for Stable Reinforcement Learning	Sep 9, 2019	Q-Learningreinforcement-learning	—Unverified
Deterministic Value-Policy Gradients	Sep 9, 2019	continuous-controlContinuous Control	—Unverified
DEAR: Deep Reinforcement Learning for Online Advertising Impression in Recommender Systems	Sep 9, 2019	ArticlesDeep Reinforcement Learning	—Unverified
Imitation Learning for Human Pose Prediction	Sep 8, 2019	Deep Reinforcement LearningHuman Pose Forecasting	—Unverified
Self-driving scale car trained by Deep reinforcement learning	Sep 8, 2019	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Personalized HeartSteps: A Reinforcement Learning Algorithm for Optimizing Physical Activity	Sep 8, 2019	reinforcement-learningReinforcement Learning	—Unverified
Soft Policy Gradient Method for Maximum Entropy Deep Reinforcement Learning	Sep 7, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Regularized Anderson Acceleration for Off-Policy Deep Reinforcement Learning	Sep 7, 2019	Deep Reinforcement LearningMuJoCo	CodeCode Available
Automatic Financial Trading Agent for Low-risk Portfolio Management using Deep Reinforcement Learning	Sep 7, 2019	Deep Reinforcement LearningManagement	—Unverified
Deep Reinforcement Learning for Control of Probabilistic Boolean Networks	Sep 7, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available
Building Task-Oriented Visual Dialog Systems Through Alternative Optimization Between Dialog Policy and Language Generation	Sep 6, 2019	DecoderReinforcement Learning	—Unverified
Adaptive Trust Region Policy Optimization: Global Convergence and Faster Rates for Regularized MDPs	Sep 6, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
DRLViz: Understanding Decisions and Memory in Deep Reinforcement Learning	Sep 6, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Blackbox Attacks on Reinforcement Learning Agents Using Approximated Temporal Information	Sep 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
Gradient Q(σ, λ): A Unified Algorithm with Function Approximation for Reinforcement Learning	Sep 6, 2019	Q-LearningReinforcement Learning	—Unverified
Efficient Communication in Multi-Agent Reinforcement Learning via Variance Based Control	Sep 6, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforcement Learning for Joint Optimization of Multiple Rewards	Sep 6, 2019	Decision MakingFairness	—Unverified
Classification with Costly Features as a Sequential Decision-Making Problem	Sep 5, 2019	ClassificationClassification with Costly Features	CodeCode Available
Spatiotemporally Constrained Action Space Attacks on Deep Reinforcement Learning Agents	Sep 5, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Rewarding Coreference Resolvers for Being Consistent with World Knowledge	Sep 5, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Learning Action-Transferable Policy with Action Embedding	Sep 5, 2019	Continuous ControlReinforcement Learning	CodeCode Available
Quasi-Newton Optimization Methods For Deep Learning Applications	Sep 4, 2019	Deep LearningDeep Reinforcement Learning	—Unverified
Q-DATA: Enhanced Traffic Flow Monitoring in Software-Defined Networks applying Q-learning	Sep 4, 2019	ManagementQ-Learning	—Unverified
No Press Diplomacy: Modeling Multi-Agent Gameplay	Sep 4, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
ACES -- Automatic Configuration of Energy Harvesting Sensors with Reinforcement Learning	Sep 4, 2019	reinforcement-learningReinforcement Learning	—Unverified
Augmented Memory Networks for Streaming-Based Active One-Shot Learning	Sep 4, 2019	Active LearningOne-Shot Learning	—Unverified
LeDeepChef: Deep Reinforcement Learning Agent for Families of Text-Based Games	Sep 4, 2019	Atari GamesDeep Reinforcement Learning	—Unverified
Inductive-bias-driven Reinforcement Learning For Efficient Schedules in Heterogeneous Clusters	Sep 4, 2019	Heuristic SearchInductive Bias	—Unverified
Answers Unite! Unsupervised Metrics for Reinforced Summarization Models	Sep 4, 2019	Abstractive Text SummarizationQuestion Answering	CodeCode Available
Learning sparse representations in reinforcement learning	Sep 4, 2019	Acrobotreinforcement-learning	—Unverified
Learning Dynamic Context Augmentation for Global Entity Linking	Sep 4, 2019	Entity DisambiguationEntity Linking	CodeCode Available

Show:10 25 50

← PrevPage 241 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified