Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12551–12600 of 15113 papers

Title	Date	Tasks	Status
Playing the lottery with rewards and multiple languages: lottery tickets in RL and NLP	Jun 6, 2019	image-classificationImage Classification	—Unverified
Risk-Sensitive Compact Decision Trees for Autonomous Execution in Presence of Simulated Market Response	Jun 5, 2019	Q-Learningreinforcement-learning	—Unverified
Probabilistic hypergraph grammars for efficient molecular optimization	Jun 5, 2019	GPUreinforcement-learning	—Unverified
Reinforcement Learning When All Actions are Not Always Available	Jun 5, 2019	AllDecision Making	CodeCode Available
Measurement-based Online Available Bandwidth Estimation employing Reinforcement Learning	Jun 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
Exploration with Unreliable Intrinsic Reward in Multi-Agent Reinforcement Learning	Jun 5, 2019	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Deep Q-Learning for Directed Acyclic Graph Generation	Jun 5, 2019	Deep Reinforcement LearningGraph Generation	—Unverified
Continuous Control for Automated Lane Change Behavior Based on Deep Deterministic Policy Gradient Algorithm	Jun 5, 2019	continuous-controlContinuous Control	—Unverified
Autonomous Reinforcement Learning of Multiple Interrelated Tasks	Jun 4, 2019	Open-Ended Question Answeringreinforcement-learning	—Unverified
Off-Policy Evaluation via Off-Policy Classification	Jun 4, 2019	ClassificationDeep Reinforcement Learning	—Unverified
Simultaneous Translation with Flexible Policy via Restricted Imitation Learning	Jun 4, 2019	Imitation Learningreinforcement-learning	—Unverified
On-board Deep Q-Network for UAV-assisted Online Power Transfer and Data Collection	Jun 4, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
Reinforcement Learning with Low-Complexity Liquid State Machines	Jun 4, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Options as responses: Grounding behavioural hierarchies in multi-agent RL	Jun 4, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Posterior Variance Analysis of Gaussian Processes with Application to Average Learning Curves	Jun 4, 2019	Gaussian Processesreinforcement-learning	—Unverified
Robust exploration in linear quadratic reinforcement learning	Jun 4, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Sequential Triggers for Watermarking of Deep Reinforcement Learning Policies	Jun 3, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reconstruct and Represent Video Contents for Captioning via Reinforcement Learning	Jun 3, 2019	Decoderreinforcement-learning	—Unverified
RL-Based Method for Benchmarking the Adversarial Resilience and Robustness of Deep Reinforcement Learning Policies	Jun 3, 2019	BenchmarkingDeep Reinforcement Learning	—Unverified
Proximal Reliability Optimization for Reinforcement Learning	Jun 3, 2019	reinforcement-learningReinforcement Learning	—Unverified
Adversarial Exploitation of Policy Imitation	Jun 3, 2019	Deep Reinforcement LearningImitation Learning	—Unverified
Learning to solve the credit assignment problem	Jun 3, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Load Balancing for Ultra-Dense Networks: A Deep Reinforcement Learning Based Approach	Jun 3, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Decentralized Deep Reinforcement Learning for Delay-Power Tradeoff in Vehicular Communications	Jun 3, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
A Semi-Supervised Approach for Low-Resourced Text Generation	Jun 3, 2019	DecoderDenoising	CodeCode Available
Deep Reinforcement Learning Architecture for Continuous Power Allocation in High Throughput Satellites	Jun 3, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Using a Logarithmic Mapping to Enable Lower Discount Factors in Reinforcement Learning	Jun 3, 2019	General Reinforcement Learningreinforcement-learning	CodeCode Available
On the Correctness and Sample Complexity of Inverse Reinforcement Learning	Jun 2, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Air Learning: A Deep Reinforcement Learning Gym for Autonomous Aerial Robot Visual Navigation	Jun 2, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available
Learner-aware Teaching: Inverse Reinforcement Learning with Preferences and Constraints	Jun 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
Automated Video Game Testing Using Synthetic and Human-Like Agents	Jun 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
An Empirical Study on Hyperparameters and their Interdependence for RL Generalization	Jun 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
The Principle of Unchanged Optimality in Reinforcement Learning Generalization	Jun 2, 2019	Benchmarkingreinforcement-learning	—Unverified
Enhanced Bayesian Compression via Deep Reinforcement Learning	Jun 1, 2019	Deep Reinforcement LearningQuantization	—Unverified
Exploiting Noisy Data in Distant Supervision Relation Classification	Jun 1, 2019	ClassificationGeneral Classification	—Unverified
Language-Driven Temporal Activity Localization: A Semantic Matching Reinforcement Learning Model	Jun 1, 2019	Action Detectionreinforcement-learning	—Unverified
Harnessing Reinforcement Learning for Neural Motion Planning	Jun 1, 2019	Motion Planningreinforcement-learning	CodeCode Available
Decision-Making in Reinforcement Learning	Jun 1, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Safety Augmented Value Estimation from Demonstrations (SAVED): Safe Deep Model-Based RL for Sparse Cost Robotic Tasks	May 31, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Attentional Policies for Cross-Context Multi-Agent Reinforcement Learning	May 31, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Interval timing in deep reinforcement learning agents	May 31, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Sequence Modeling of Temporal Credit Assignment for Episodic Reinforcement Learning	May 31, 2019	Deep Reinforcement LearningMuJoCo	CodeCode Available
Rewarding Smatch: Transition-Based AMR Parsing with Reinforcement Learning	May 31, 2019	AMR Parsingreinforcement-learning	—Unverified
Reinforcement Learning Experience Reuse with Policy Residual Representation	May 31, 2019	reinforcement-learningReinforcement Learning	—Unverified
Towards Finding Longer Proofs	May 30, 2019	Automated Theorem Provingreinforcement-learning	CodeCode Available
Reinforcement Learning and Adaptive Sampling for Optimized DNN Compilation	May 30, 2019	ClusteringDiversity	CodeCode Available
Reinforcement Learning for Mean Field Game	May 30, 2019	reinforcement-learningReinforcement Learning	—Unverified
On Value Functions and the Agent-Environment Boundary	May 30, 2019	Imitation Learningreinforcement-learning	—Unverified
Finite-time Analysis of Approximate Policy Iteration for the Linear Quadratic Regulator	May 30, 2019	continuous-controlContinuous Control	—Unverified
Defining Admissible Rewards for High Confidence Policy Evaluation	May 30, 2019	Off-policy evaluationReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 252 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified