Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 13001–13050 of 15113 papers

Title	Date	Tasks	Status
Learning Deterministic Policy with Target for Power Control in Wireless Networks	Feb 21, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Statistics and Samples in Distributional Reinforcement Learning	Feb 21, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Curiosity-Driven Experience Prioritization via Density Estimation	Feb 20, 2019	Density EstimationOpenAI Gym	—Unverified
Beyond Confidence Regions: Tight Bayesian Ambiguity Sets for Robust MDPs	Feb 20, 2019	Bayesian InferencePosition	CodeCode Available
From Language to Goals: Inverse Reinforcement Learning for Vision-Based Instruction Following	Feb 20, 2019	Instruction Followingreinforcement-learning	—Unverified
Emergent Coordination Through Competition	Feb 19, 2019	continuous-controlContinuous Control	—Unverified
DOM-Q-NET: Grounded RL on Structured Language	Feb 19, 2019	Deep Reinforcement LearningGraph Neural Network	CodeCode Available
Deep Reinforcement Learning using Genetic Algorithm for Parameter Optimization	Feb 19, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
A novel repetition normalized adversarial reward for headline generation	Feb 19, 2019	Headline Generationreinforcement-learning	—Unverified
Hyperbolic Discounting and Learning over Multiple Horizons	Feb 19, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Investigating Generalisation in Continuous Deep Reinforcement Learning	Feb 19, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Message-Dropout: An Efficient Training Method for Multi-Agent Deep Reinforcement Learning	Feb 18, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Parenting: Safe Reinforcement Learning from Human Input	Feb 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
A new Potential-Based Reward Shaping for Reinforcement Learning Agent	Feb 17, 2019	Atari Gamesreinforcement-learning	—Unverified
Leveraging Communication Topologies Between Learning Agents in Deep Reinforcement Learning	Feb 16, 2019	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Heuristics, Answer Set Programming and Markov Decision Process for Solving a Set of Spatial Puzzles	Feb 16, 2019	Q-LearningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning Based High-level Driving Behavior Decision-making Model in Heterogeneous Traffic	Feb 15, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Asynchronous Coagent Networks	Feb 15, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Neural-encoding Human Experts' Domain Knowledge to Warm Start Reinforcement Learning	Feb 15, 2019	Deep Reinforcement LearningImitation Learning	CodeCode Available
Robust Reinforcement Learning in POMDPs with Incomplete and Noisy Observations	Feb 15, 2019	continuous-controlContinuous Control	—Unverified
Unsupervised Visuomotor Control through Distributional Planning Networks	Feb 14, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Active Perception in Adversarial Scenarios using Maximum Entropy Deep Reinforcement Learning	Feb 14, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning to Optimize Long-term User Engagement in Recommender Systems	Feb 13, 2019	Recommendation Systemsreinforcement-learning	—Unverified
Reinforcement Learning for UA V Attitude Control	Feb 13, 2019	reinforcement-learningReinforcement Learning	—Unverified
Preferences Implicit in the State of the World	Feb 12, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
ACTRCE: Augmenting Experience via Teacher's Advice For Multi-Goal Reinforcement Learning	Feb 12, 2019	Multi-Goal Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning from Policy-Dependent Human Feedback	Feb 12, 2019	Deep Reinforcement LearningMinecraft	—Unverified
Latent Space Reinforcement Learning for Steering Angle Prediction	Feb 11, 2019	Deep Reinforcement LearningPrediction	—Unverified
Generalization through Simulation: Integrating Simulated and Real Data into Deep Reinforcement Learning for Vision-Based Autonomous Flight	Feb 11, 2019	Collision AvoidanceDeep Reinforcement Learning	CodeCode Available
Performance Dynamics and Termination Errors in Reinforcement Learning: A Unifying Perspective	Feb 11, 2019	reinforcement-learningReinforcement Learning	—Unverified
Stochastic Reinforcement Learning	Feb 11, 2019	reinforcement-learningReinforcement Learning	—Unverified
Whole-Chain Recommendations	Feb 11, 2019	Multi-agent Reinforcement LearningRecommendation Systems	—Unverified
WiseMove: A Framework for Safe Deep Reinforcement Learning for Autonomous Driving	Feb 11, 2019	Autonomous DrivingDeep Reinforcement Learning	—Unverified
A Bandit Framework for Optimal Selection of Reinforcement Learning Agents	Feb 10, 2019	Deep Reinforcement LearningInductive Bias	—Unverified
Reinforcement Learning from Hierarchical Critics	Feb 8, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Distributional reinforcement learning with linear function approximation	Feb 8, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Novelty Search for Deep Reinforcement Learning Policy Network Weights by Action Sequence Edit Metric Distance	Feb 8, 2019	Deep Reinforcement LearningEvolutionary Algorithms	CodeCode Available
Rethinking the Discount Factor in Reinforcement Learning: A Decision Theoretic Approach	Feb 8, 2019	Decision Makingreinforcement-learning	—Unverified
Metaoptimization on a Distributed System for Deep Reinforcement Learning	Feb 7, 2019	Atari GamesDeep Reinforcement Learning	—Unverified
Visual search and recognition for robot task execution and monitoring	Feb 7, 2019	Common Sense ReasoningDeep Reinforcement Learning	—Unverified
Artificial Intelligence for Prosthetics - challenge solutions	Feb 7, 2019	Deep Reinforcement LearningImitation Learning	CodeCode Available
Bayesian Reinforcement Learning via Deep, Sparse Sampling	Feb 7, 2019	Efficient Explorationreinforcement-learning	CodeCode Available
Decentralized Multi-Agents by Imitation of a Centralized Controller	Feb 6, 2019	Imitation LearningMulti-agent Reinforcement Learning	—Unverified
A Guiding Principle for Causal Decision Problems	Feb 6, 2019	Decision Makingreinforcement-learning	—Unverified
On L_2-consistency of nearest neighbor matching	Feb 6, 2019	Causal InferenceDomain Adaptation	—Unverified
Neural Fictitious Self-Play on ELF Mini-RTS	Feb 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
Space Navigator: a Tool for the Optimization of Collision Avoidance Maneuvers	Feb 6, 2019	Collision Avoidancereinforcement-learning	—Unverified
Separating value functions across time-scales	Feb 5, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Reinforcement Learning for Optimal Load Distribution Sequencing in Resource-Sharing System	Feb 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
Polyphonic Music Composition with LSTM Neural Networks and Reinforcement Learning	Feb 5, 2019	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 261 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified