Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12401–12450 of 15113 papers

Title	Date	Tasks	Status
DeepMDP: Learning Continuous Latent Space Models for Representation Learning	Jun 6, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning for Multi-objective Optimization	Jun 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Combining Reinforcement Learning and Configuration Checking for Maximum k-plex Problem	Jun 6, 2019	Combinatorial Optimizationreinforcement-learning	—Unverified
Measurement-based Online Available Bandwidth Estimation employing Reinforcement Learning	Jun 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning When All Actions are Not Always Available	Jun 5, 2019	AllDecision Making	CodeCode Available
Probabilistic hypergraph grammars for efficient molecular optimization	Jun 5, 2019	GPUreinforcement-learning	—Unverified
Risk-Sensitive Compact Decision Trees for Autonomous Execution in Presence of Simulated Market Response	Jun 5, 2019	Q-Learningreinforcement-learning	—Unverified
Exploration with Unreliable Intrinsic Reward in Multi-Agent Reinforcement Learning	Jun 5, 2019	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Deep Q-Learning for Directed Acyclic Graph Generation	Jun 5, 2019	Deep Reinforcement LearningGraph Generation	—Unverified
Continuous Control for Automated Lane Change Behavior Based on Deep Deterministic Policy Gradient Algorithm	Jun 5, 2019	continuous-controlContinuous Control	—Unverified
On-board Deep Q-Network for UAV-assisted Online Power Transfer and Data Collection	Jun 4, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
Simultaneous Translation with Flexible Policy via Restricted Imitation Learning	Jun 4, 2019	Imitation Learningreinforcement-learning	—Unverified
Posterior Variance Analysis of Gaussian Processes with Application to Average Learning Curves	Jun 4, 2019	Gaussian Processesreinforcement-learning	—Unverified
Options as responses: Grounding behavioural hierarchies in multi-agent RL	Jun 4, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Reinforcement Learning with Low-Complexity Liquid State Machines	Jun 4, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Autonomous Reinforcement Learning of Multiple Interrelated Tasks	Jun 4, 2019	Open-Ended Question Answeringreinforcement-learning	—Unverified
Robust exploration in linear quadratic reinforcement learning	Jun 4, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Off-Policy Evaluation via Off-Policy Classification	Jun 4, 2019	ClassificationDeep Reinforcement Learning	—Unverified
Reconstruct and Represent Video Contents for Captioning via Reinforcement Learning	Jun 3, 2019	Decoderreinforcement-learning	—Unverified
RL-Based Method for Benchmarking the Adversarial Resilience and Robustness of Deep Reinforcement Learning Policies	Jun 3, 2019	BenchmarkingDeep Reinforcement Learning	—Unverified
Sequential Triggers for Watermarking of Deep Reinforcement Learning Policies	Jun 3, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Proximal Reliability Optimization for Reinforcement Learning	Jun 3, 2019	reinforcement-learningReinforcement Learning	—Unverified
Adversarial Exploitation of Policy Imitation	Jun 3, 2019	Deep Reinforcement LearningImitation Learning	—Unverified
Deep Reinforcement Learning Architecture for Continuous Power Allocation in High Throughput Satellites	Jun 3, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning to solve the credit assignment problem	Jun 3, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Load Balancing for Ultra-Dense Networks: A Deep Reinforcement Learning Based Approach	Jun 3, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Semi-Supervised Approach for Low-Resourced Text Generation	Jun 3, 2019	DecoderDenoising	CodeCode Available
Using a Logarithmic Mapping to Enable Lower Discount Factors in Reinforcement Learning	Jun 3, 2019	General Reinforcement Learningreinforcement-learning	CodeCode Available
Decentralized Deep Reinforcement Learning for Delay-Power Tradeoff in Vehicular Communications	Jun 3, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
The Principle of Unchanged Optimality in Reinforcement Learning Generalization	Jun 2, 2019	Benchmarkingreinforcement-learning	—Unverified
Automated Video Game Testing Using Synthetic and Human-Like Agents	Jun 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learner-aware Teaching: Inverse Reinforcement Learning with Preferences and Constraints	Jun 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
An Empirical Study on Hyperparameters and their Interdependence for RL Generalization	Jun 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
On the Correctness and Sample Complexity of Inverse Reinforcement Learning	Jun 2, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Air Learning: A Deep Reinforcement Learning Gym for Autonomous Aerial Robot Visual Navigation	Jun 2, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available
Exploiting Noisy Data in Distant Supervision Relation Classification	Jun 1, 2019	ClassificationGeneral Classification	—Unverified
Decision-Making in Reinforcement Learning	Jun 1, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Harnessing Reinforcement Learning for Neural Motion Planning	Jun 1, 2019	Motion Planningreinforcement-learning	CodeCode Available
Enhanced Bayesian Compression via Deep Reinforcement Learning	Jun 1, 2019	Deep Reinforcement LearningQuantization	—Unverified
Language-Driven Temporal Activity Localization: A Semantic Matching Reinforcement Learning Model	Jun 1, 2019	Action Detectionreinforcement-learning	—Unverified
Safety Augmented Value Estimation from Demonstrations (SAVED): Safe Deep Model-Based RL for Sparse Cost Robotic Tasks	May 31, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Interval timing in deep reinforcement learning agents	May 31, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Attentional Policies for Cross-Context Multi-Agent Reinforcement Learning	May 31, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning Experience Reuse with Policy Residual Representation	May 31, 2019	reinforcement-learningReinforcement Learning	—Unverified
Sequence Modeling of Temporal Credit Assignment for Episodic Reinforcement Learning	May 31, 2019	Deep Reinforcement LearningMuJoCo	CodeCode Available
Rewarding Smatch: Transition-Based AMR Parsing with Reinforcement Learning	May 31, 2019	AMR Parsingreinforcement-learning	—Unverified
On Value Functions and the Agent-Environment Boundary	May 30, 2019	Imitation Learningreinforcement-learning	—Unverified
Reinforcement Learning for Mean Field Game	May 30, 2019	reinforcement-learningReinforcement Learning	—Unverified
Don't Forget Your Teacher: A Corrective Reinforcement Learning Framework	May 30, 2019	reinforcement-learningReinforcement Learning	—Unverified
Combating the Compounding-Error Problem with a Multi-step Model	May 30, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 249 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified