Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14351–14400 of 15113 papers

Title	Date	Tasks	Status	Hype
Deep Q-Learning for Self-Organizing Networks Fault Management and Radio Performance Improvement	Jul 10, 2017	Deep Reinforcement LearningManagement	—Unverified	0
Emergence of Locomotion Behaviours in Rich Environments	Jul 7, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	1
Learning human behaviors from motion capture by adversarial imitation	Jul 7, 2017	Deep Reinforcement LearningImitation Learning	CodeCode Available	0
Trust-PCL: An Off-Policy Trust Region Method for Continuous Control	Jul 6, 2017	continuous-controlContinuous Control	—Unverified	0
The Complex Negotiation Dialogue Game	Jul 5, 2017	One-Shot LearningPosition	—Unverified	0
Hindsight Experience Replay	Jul 5, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Learning to Design Games: Strategic Environments in Reinforcement Learning	Jul 5, 2017	Game Designreinforcement-learning	—Unverified	0
OPEB: Open Physical Environment Benchmark for Artificial Intelligence	Jul 4, 2017	continuous-controlContinuous Control	—Unverified	0
ELF: An Extensive, Lightweight and Flexible Research Platform for Real-time Strategy Games	Jul 4, 2017	Atari GamesGPU	CodeCode Available	0
Maintaining cooperation in complex social dilemmas using deep reinforcement learning	Jul 4, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Efficient Probabilistic Performance Bounds for Inverse Reinforcement Learning	Jul 3, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Hashing over Predicted Future Frames for Informed Exploration of Deep Reinforcement Learning	Jul 3, 2017	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
Grammatical Error Correction with Neural Reinforcement Learning	Jul 2, 2017	DecoderGrammatical Error Correction	—Unverified	0
Action-Decision Networks for Visual Tracking With Deep Reinforcement Learning	Jul 1, 2017	Deep Reinforcement LearningGPU	CodeCode Available	0
Sample-efficient Actor-Critic Reinforcement Learning with Supervised Data for Dialogue Management	Jul 1, 2017	Deep Reinforcement LearningDialogue Management	—Unverified	0
Neural Sequence Model Training via α-divergence Minimization	Jun 30, 2017	Machine Translationmodel	CodeCode Available	0
A Deep Reinforcement Learning Framework for the Financial Portfolio Management Problem	Jun 30, 2017	Deep Reinforcement LearningManagement	CodeCode Available	1
Noisy Networks for Exploration	Jun 30, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Path Integral Networks: End-to-End Differentiable Optimal Control	Jun 29, 2017	continuous-controlContinuous Control	—Unverified	0
Learning to Learn: Meta-Critic Networks for Sample Efficient Learning	Jun 29, 2017	Meta-Learningreinforcement-learning	—Unverified	0
Actor-Critic Sequence Training for Image Captioning	Jun 29, 2017	AI AgentImage Captioning	—Unverified	0
Neural SLAM: Learning to Explore with External Memory	Jun 29, 2017	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Interpretability via Model Extraction	Jun 29, 2017	BIG-bench Machine Learningmodel	—Unverified	0
Uncertainty Decomposition in Bayesian Neural Networks with Latent Variables	Jun 26, 2017	Active Learningreinforcement-learning	—Unverified	0
Count-Based Exploration in Feature Space for Reinforcement Learning	Jun 25, 2017	Atari GamesEfficient Exploration	CodeCode Available	0
Temporal-related Convolutional-Restricted-Boltzmann-Machine capable of learning relational order via reinforcement learning procedure?	Jun 24, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
A Self-Adaptive Proposal Model for Temporal Action Detection based on Reinforcement Learning	Jun 22, 2017	Action DetectionPosition	CodeCode Available	0
Structure Learning in Motor Control:A Deep Reinforcement Learning Model	Jun 21, 2017	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified	0
Observational Learning by Reinforcement Learning	Jun 20, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Policy Gradient Methods for Reinforcement Learning with Function Approximation and Action-Dependent Baselines	Jun 20, 2017	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Toward Real-Time Decentralized Reinforcement Learning using Finite Support Basis Functions	Jun 20, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Data-Efficient Reinforcement Learning with Probabilistic Model Predictive Control	Jun 20, 2017	Gaussian ProcessesModel Predictive Control	CodeCode Available	0
Dex: Incremental Learning for Complex Environments in Deep Reinforcement Learning	Jun 19, 2017	Continual LearningDeep Reinforcement Learning	CodeCode Available	0
Pedestrian Prediction by Planning using Deep Neural Networks	Jun 19, 2017	Autonomous VehiclesCollision Avoidance	—Unverified	0
Sub-domain Modelling for Dialogue Management with Hierarchical Reinforcement Learning	Jun 19, 2017	Dialogue ManagementHierarchical Reinforcement Learning	—Unverified	0
Value-Decomposition Networks For Cooperative Multi-Agent Learning	Jun 16, 2017	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep learning-based numerical methods for high-dimensional parabolic partial differential equations and backward stochastic differential equations	Jun 15, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Reinforcement Learning under Model Mismatch	Jun 15, 2017	modelQ-Learning	—Unverified	0
Zero-Shot Task Generalization with Multi-Task Deep Reinforcement Learning	Jun 15, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Reinforcement Learning with Budget-Constrained Nonparametric Function Approximation for Opportunistic Spectrum Access	Jun 14, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
On Optimistic versus Randomized Exploration in Reinforcement Learning	Jun 13, 2017	Computational Efficiencyreinforcement-learning	—Unverified	0
Device Placement Optimization with Reinforcement Learning	Jun 13, 2017	Language ModelingLanguage Modelling	CodeCode Available	0
Hybrid Reward Architecture for Reinforcement Learning	Jun 13, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Deep reinforcement learning from human preferences	Jun 12, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
ACCNet: Actor-Coordinator-Critic Net for "Learning-to-Communicate" with Deep Multi-agent Reinforcement Learning	Jun 10, 2017	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Symmetry Learning for Function Approximation in Reinforcement Learning	Jun 9, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Unlocking the Potential of Simulators: Design with RL in Mind	Jun 8, 2017	Decision MakingFriction	—Unverified	0
Efficient Reinforcement Learning via Initial Pure Exploration	Jun 7, 2017	Multi-Armed Banditsreinforcement-learning	—Unverified	0
Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments	Jun 7, 2017	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	1
Parameter Space Noise for Exploration	Jun 6, 2017	continuous-controlContinuous Control	CodeCode Available	0

Show:10 25 50

← PrevPage 288 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified