Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14101–14150 of 15113 papers

Title	Date	Tasks	Status
Combination of Supervised and Reinforcement Learning For Vision-Based Autonomous Control	Jan 1, 2018	MuJoCoreinforcement-learning	—Unverified
Learning Dynamic State Abstractions for Model-Based Reinforcement Learning	Jan 1, 2018	Atari GamesDecision Making	—Unverified
Learning an Embedding Space for Transferable Robot Skills	Jan 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning to Treat Sepsis with Multi-Output Gaussian Process Deep Recurrent Q-Networks	Jan 1, 2018	Deep Reinforcement LearningGaussian Processes	—Unverified
Autonomous Vehicle Fleet Coordination With Deep Reinforcement Learning	Jan 1, 2018	Autonomous VehiclesDecision Making	—Unverified
Avoiding Catastrophic States with Intrinsic Fear	Jan 1, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Representing Entropy : A short proof of the equivalence between soft Q-learning and policy gradients	Jan 1, 2018	Q-Learningreinforcement-learning	—Unverified
NerveNet: Learning Structured Policy with Graph Neural Networks	Jan 1, 2018	Benchmarkingcontinuous-control	CodeCode Available
Reinforcement Learning via Replica Stacking of Quantum Measurements for the Training of Quantum Boltzmann Machines	Jan 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Policy Gradient For Multidimensional Action Spaces: Action Sampling and Entropy Bonus	Jan 1, 2018	Atari GamesDeep Reinforcement Learning	—Unverified
Neural Task Graph Execution	Jan 1, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Universal Agent for Disentangling Environments and Tasks	Jan 1, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Model-based imitation learning from state trajectories	Jan 1, 2018	Imitation Learningmodel	—Unverified
Predicting Multiple Actions for Stochastic Continuous Control	Jan 1, 2018	continuous-controlContinuous Control	—Unverified
Neuron as an Agent	Jan 1, 2018	counterfactualMulti-agent Reinforcement Learning	—Unverified
Using Deep Reinforcement Learning to Generate Rationales for Molecules	Jan 1, 2018	Deep Reinforcement LearningDrug Design	—Unverified
Residual Loss Prediction: Reinforcement Learning With No Incremental Feedback	Jan 1, 2018	Multi-Armed BanditsPrediction	CodeCode Available
LSD-Net: Look, Step and Detect for Joint Navigation and Multi-View Recognition with Deep Reinforcement Learning	Jan 1, 2018	Deep Reinforcement LearningGeneral Classification	—Unverified
Reward Estimation via State Prediction	Jan 1, 2018	Predictionreinforcement-learning	—Unverified
Now I Remember! Episodic Memory For Reinforcement Learning	Jan 1, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning Structural Weight Uncertainty for Sequential Decision-Making	Dec 30, 2017	Decision MakingMulti-Armed Bandits	CodeCode Available
Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward	Dec 29, 2017	Decision MakingDeep Reinforcement Learning	CodeCode Available
SBEED: Convergent Reinforcement Learning with Nonlinear Function Approximation	Dec 29, 2017	Q-Learningreinforcement-learning	—Unverified
Multi-timescale memory dynamics in a reinforcement learning network with attention-gated memory	Dec 28, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning with Analogical Similarity to Guide Schema Induction and Attention	Dec 28, 2017	Analogical Similarityreinforcement-learning	—Unverified
Consensus-based Sequence Training for Video Captioning	Dec 27, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
A short variational proof of equivalence between policy gradients and soft Q learning	Dec 22, 2017	Q-Learningreinforcement-learning	—Unverified
Least-Squares Temporal Difference Learning for the Linear Quadratic Regulator	Dec 22, 2017	continuous-controlContinuous Control	—Unverified
Federated Control with Hierarchical Multi-Agent Deep Reinforcement Learning	Dec 22, 2017	Deep Reinforcement LearningEfficient Exploration	CodeCode Available
Multiagent-based Participatory Urban Simulation through Inverse Reinforcement Learning	Dec 21, 2017	reinforcement-learningReinforcement Learning	—Unverified
Recurrent Attentional Reinforcement Learning for Multi-label Image Recognition	Dec 20, 2017	Multi-Label Image Recognitionreinforcement-learning	—Unverified
Revisiting the Master-Slave Architecture in Multi-Agent Deep Reinforcement Learning	Dec 20, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Pseudorehearsal in actor-critic agents with neural network function approximation	Dec 20, 2017	reinforcement-learningReinforcement Learning	—Unverified
Hierarchical and Interpretable Skill Acquisition in Multi-task Reinforcement Learning	Dec 20, 2017	Minecraftreinforcement-learning	—Unverified
Two-dimensional Anti-jamming Mobile Communication Based on Reinforcement Learning	Dec 19, 2017	reinforcement-learningReinforcement Learning	—Unverified
On Wasserstein Reinforcement Learning and the Fokker-Planck equation	Dec 19, 2017	reinforcement-learningReinforcement Learning	—Unverified
On the Relationship Between the OpenAI Evolution Strategy and Stochastic Gradient Descent	Dec 18, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
ES Is More Than Just a Traditional Finite-Difference Approximator	Dec 18, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Improving Exploration in Evolution Strategies for Deep Reinforcement Learning via a Population of Novelty-Seeking Agents	Dec 18, 2017	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available
Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning	Dec 18, 2017	Deep Reinforcement LearningEvolutionary Algorithms	CodeCode Available
Integral Equations and Machine Learning	Dec 17, 2017	BIG-bench Machine LearningImage Generation	—Unverified
Towards a Deep Reinforcement Learning Approach for Tower Line Wars	Dec 17, 2017	Deep Reinforcement LearningQ-Learning	—Unverified
Occam's razor is insufficient to infer the preferences of irrational agents	Dec 15, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Hierarchical Text Generation and Planning for Strategic Dialogue	Dec 15, 2017	Decision Makingreinforcement-learning	CodeCode Available
Differentiable lower bound for expected BLEU score	Dec 13, 2017	reinforcement-learningReinforcement Learning	CodeCode Available
Inverse Reinforcement Learning for Marketing	Dec 13, 2017	Marketingreinforcement-learning	—Unverified
QLBS: Q-Learner in the Black-Scholes(-Merton) Worlds	Dec 13, 2017	BenchmarkingModel-based Reinforcement Learning	CodeCode Available
Multi-focus Attention Network for Efficient Deep Reinforcement Learning	Dec 13, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified
Simulated Autonomous Driving on Realistic Road Networks using Deep Reinforcement Learning	Dec 12, 2017	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning Boosted by External Knowledge	Dec 12, 2017	Atari GamesDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 283 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified