Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14951–15000 of 15113 papers

Title	Date	Tasks	Status
An agent-driven semantical identifier using radial basis neural networks and reinforcement learning	Sep 30, 2014	Authorship AttributionInformation Retrieval	—Unverified
RESEARCH ARTICLE A Reinforcement Learning Model of Joy, Distress, Hope and Fear	Sep 8, 2014	reinforcement-learningReinforcement Learning (RL)	—Unverified
Inverse Reinforcement Learning with Multi-Relational Chains for Robot-Centered Smart Home	Aug 16, 2014	reinforcement-learningReinforcement Learning	—Unverified
Probabilistic inverse reinforcement learning in unknown environments	Aug 9, 2014	Bayesian Inferencereinforcement-learning	—Unverified
Learning to Cooperate via Policy Search	Aug 7, 2014	Q-Learningreinforcement-learning	—Unverified
Reinforcement Learning of Cooperative Persuasive Dialogue Policies using Framing	Aug 1, 2014	reinforcement-learningReinforcement Learning	—Unverified
MONEYBaRL: Exploiting pitcher decision-making using Reinforcement Learning	Jul 31, 2014	BIG-bench Machine LearningDecision Making	—Unverified
Learning in games via reinforcement and regularization	Jul 23, 2014	reinforcement-learningReinforcement Learning	—Unverified
Practical Kernel-Based Reinforcement Learning	Jul 21, 2014	reinforcement-learningReinforcement Learning	—Unverified
Extreme State Aggregation Beyond MDPs	Jul 12, 2014	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Based Algorithm for the Maximization of EV Charging Station Revenue	Jul 4, 2014	Q-Learningreinforcement-learning	—Unverified
Thompson Sampling for Learning Parameterized Markov Decision Processes	Jun 29, 2014	Formreinforcement-learning	—Unverified
Reinforcement and Imitation Learning via Interactive No-Regret Learning	Jun 23, 2014	Imitation Learningreinforcement-learning	—Unverified
Deterministic Policy Gradient Algorithms	Jun 22, 2014	Formreinforcement-learning	CodeCode Available
Personalized Medical Treatments Using Novel Reinforcement Learning Algorithms	Jun 16, 2014	Q-Learningreinforcement-learning	—Unverified
Multi-objective Reinforcement Learning with Continuous Pareto Frontier Approximation Supplementary Material	Jun 13, 2014	Multi-Objective Reinforcement Learningreinforcement-learning	—Unverified
Model-based Reinforcement Learning and the Eluder Dimension	Jun 7, 2014	modelModel-based Reinforcement Learning	—Unverified
Single-Agent vs. Multi-Agent Techniques for Concurrent Reinforcement Learning of Negotiation Dialogue Policies	Jun 1, 2014	Dialogue ManagementMulti-agent Reinforcement Learning	—Unverified
Comparing Multi-label Classification with Reinforcement Learning for Summarisation of Time-series Data	Jun 1, 2014	General ClassificationMulti-Label Classification	—Unverified
Proximal Reinforcement Learning: A New Theory of Sequential Decision Making in Primal-Dual Spaces	May 26, 2014	Decision Makingreinforcement-learning	—Unverified
Projective simulation applied to the grid-world and the mountain-car problem	May 21, 2014	Benchmarkingreinforcement-learning	—Unverified
Off-Policy Shaping Ensembles in Reinforcement Learning	May 21, 2014	Computational Efficiencyreinforcement-learning	—Unverified
Structural Return Maximization for Reinforcement Learning	May 12, 2014	Learning Theoryreinforcement-learning	—Unverified
Selecting Near-Optimal Approximate State Representations in Reinforcement Learning	May 12, 2014	reinforcement-learningReinforcement Learning	—Unverified
DINASTI: Dialogues with a Negotiating Appointment Setting Interface	May 1, 2014	Dialogue ManagementManagement	—Unverified
Deep Learning in Neural Networks: An Overview	Apr 30, 2014	BIG-bench Machine LearningDeep Learning	CodeCode Available
Undirected Machine Translation with Discriminative Reinforcement Learning	Apr 1, 2014	Language ModellingMachine Translation	—Unverified
Comparison of Multi-agent and Single-agent Inverse Learning on a Simulated Soccer Example	Mar 26, 2014	reinforcement-learningReinforcement Learning	—Unverified
Multi-agent Inverse Reinforcement Learning for Two-person Zero-sum Games	Mar 25, 2014	reinforcement-learningReinforcement Learning	—Unverified
Simultaneous Perturbation Algorithms for Batch Off-Policy Search	Mar 18, 2014	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Near-optimal Reinforcement Learning in Factored MDPs	Mar 15, 2014	reinforcement-learningReinforcement Learning	—Unverified
Intrinsically Motivated Learning of Visual Motion Perception and Smooth Pursuit	Feb 14, 2014	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Better Optimism By Bayes: Adaptive Planning with Rich Models	Feb 9, 2014	Model-based Reinforcement LearningReinforcement Learning	—Unverified
Generalization and Exploration via Randomized Value Functions	Feb 4, 2014	Efficient Explorationreinforcement-learning	CodeCode Available
Safe Exploration of State and Action Spaces in Reinforcement Learning	Feb 4, 2014	Efficient ExplorationManagement	—Unverified
Non-Deterministic Policies in Markovian Decision Processes	Jan 16, 2014	Decision Makingreinforcement-learning	—Unverified
Kalman Temporal Differences	Jan 16, 2014	Managementreinforcement-learning	—Unverified
Learning Partially Observable Deterministic Action Models	Jan 15, 2014	Partially Observable Reinforcement Learningreinforcement-learning	—Unverified
A Multiagent Reinforcement Learning Algorithm with Non-linear Dynamics	Jan 15, 2014	reinforcement-learningReinforcement Learning	—Unverified
Exploiting generalisation symmetries in accuracy-based learning classifier systems: An initial study	Jan 10, 2014	reinforcement-learningReinforcement Learning	—Unverified
DJ-MC: A Reinforcement-Learning Agent for Music Playlist Recommendation	Jan 9, 2014	Music RecommendationRecommendation Systems	—Unverified
Optimal Demand Response Using Device Based Reinforcement Learning	Jan 8, 2014	energy managementManagement	—Unverified
Policy Shaping: Integrating Human Feedback with Reinforcement Learning	Dec 1, 2013	reinforcement-learningReinforcement Learning	—Unverified
Projected Natural Actor-Critic	Dec 1, 2013	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in Robust Markov Decision Processes	Dec 1, 2013	reinforcement-learningReinforcement Learning	—Unverified
Using reinforcement learning to find an optimal set of features	Dec 1, 2013	feature selectionreinforcement-learning	CodeCode Available
Bellman Error Based Feature Generation using Random Projections on Sparse Spaces	Dec 1, 2013	reinforcement-learningReinforcement Learning	—Unverified
Efficient Exploration and Value Function Generalization in Deterministic Systems	Dec 1, 2013	Efficient Explorationreinforcement-learning	—Unverified
Off-policy reinforcement learning for H_ control design	Nov 24, 2013	reinforcement-learningReinforcement Learning	—Unverified
Risk-sensitive Reinforcement Learning	Nov 8, 2013	Decision MakingQ-Learning	—Unverified

Show:10 25 50

← PrevPage 300 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified