Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11601–11650 of 15113 papers

Title	Date	Tasks	Status
Deep RL-based Trajectory Planning for AoI Minimization in UAV-assisted IoT	Dec 9, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Learning Sparse Representations Incrementally in Deep Reinforcement Learning	Dec 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
ChainerRL: A Deep Reinforcement Learning Library	Dec 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Exploratory Not Explanatory: Counterfactual Analysis of Saliency Maps for Deep Reinforcement Learning	Dec 9, 2019	Atari Gamescounterfactual	—Unverified
Intelligent Coordination among Multiple Traffic Intersections Using Multi-Agent Reinforcement Learning	Dec 9, 2019	AI AgentMulti-agent Reinforcement Learning	—Unverified
Learning Latent State Spaces for Planning through Reward Prediction	Dec 9, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Efficient Object Detection in Large Images using Deep Reinforcement Learning	Dec 9, 2019	Deep Reinforcement Learningobject-detection	CodeCode Available
Unsupervised Curricula for Visual Meta-Reinforcement Learning	Dec 9, 2019	ClusteringMeta-Learning	—Unverified
Transformer Based Reinforcement Learning For Games	Dec 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Optimism in Reinforcement Learning with Generalized Linear Function Approximation	Dec 9, 2019	reinforcement-learningReinforcement Learning	—Unverified
Effects of a Social Force Model reward in Robot Navigation based on Deep Reinforcement Learning	Dec 8, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified
Increasing performance of electric vehicles in ride-hailing services using deep reinforcement learning	Dec 7, 2019	Autonomous VehiclesDecision Making	CodeCode Available
Hierarchical Cooperative Multi-Agent Reinforcement Learning with Skill Discovery	Dec 7, 2019	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available
From Reinforcement Learning to Optimal Control: A unified framework for sequential decisions	Dec 7, 2019	reinforcement-learningReinforcement Learning	—Unverified
No-Regret Exploration in Goal-Oriented Reinforcement Learning	Dec 7, 2019	Atari Gamesreinforcement-learning	—Unverified
Making Smart Homes Smarter: Optimizing Energy Consumption with Human in the Loop	Dec 6, 2019	ClusteringReinforcement Learning	—Unverified
Observational Overfitting in Reinforcement Learning	Dec 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
A pedestrian path-planning model in accordance with obstacle's danger with reinforcement learning	Dec 6, 2019	Collision Avoidancereinforcement-learning	—Unverified
How Does an Approximate Model Help in Reinforcement Learning?	Dec 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for Routing a Heterogeneous Fleet of Vehicles	Dec 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Alternative Function Approximation Parameterizations for Solving Games: An Analysis of f-Regression Counterfactual Regret Minimization	Dec 6, 2019	counterfactualregression	—Unverified
Iterative Policy-Space Expansion in Reinforcement Learning	Dec 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Non-Markovian Rewards	Dec 5, 2019	Q-Learningreinforcement-learning	—Unverified
Hindsight Credit Assignment	Dec 5, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Inter-Level Cooperation in Hierarchical Reinforcement Learning	Dec 5, 2019	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available
Blind Inpainting of Large-scale Masks of Thin Structures with Adversarial and Reinforcement Learning	Dec 5, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Dynamic Pricing on E-commerce Platform with Deep Reinforcement Learning: A Field Experiment	Dec 5, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning with Convolutional Reservoir Computing	Dec 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
Training Agents using Upside-Down Reinforcement Learning	Dec 5, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Scalable Reinforcement Learning for Multi-Agent Networked Systems	Dec 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Upside Down: Don't Predict Rewards -- Just Map Them to Actions	Dec 5, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement learning for bandwidth estimation and congestion control in real-time communications	Dec 4, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep Model Compression Via Two-Stage Deep Reinforcement Learning	Dec 4, 2019	Autonomous DrivingDeep Reinforcement Learning	—Unverified
AlgaeDICE: Policy Gradient from Arbitrary Experience	Dec 4, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Neighborhood Cognition Consistent Multi-Agent Reinforcement Learning	Dec 3, 2019	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Mo' States Mo' Problems: Emergency Stop Mechanisms from Observation	Dec 3, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Optimal Policies Tend to Seek Power	Dec 3, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Self-Learned Formula Synthesis in Set Theory	Dec 3, 2019	reinforcement-learningReinforcement Learning	—Unverified
SafeLife 1.0: Exploring Side Effects in Complex Environments	Dec 3, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Policy Optimization Reinforcement Learning with Entropy Regularization	Dec 2, 2019	Continuous Controlreinforcement-learning	—Unverified
Human-Robot Collaboration via Deep Reinforcement Learning of Real-World Interactions	Dec 2, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Just Ask:An Interactive Learning Framework for Vision and Language Navigation	Dec 2, 2019	Continual LearningData Augmentation	—Unverified
A Model-Based Reinforcement Learning with Adversarial Training for Online Recommendation	Dec 1, 2019	Generative Adversarial NetworkModel-based Reinforcement Learning	CodeCode Available
Learning Generalizable Device Placement Algorithms for Distributed Machine Learning	Dec 1, 2019	BIG-bench Machine LearningReinforcement Learning	CodeCode Available
Adaptive Auxiliary Task Weighting for Reinforcement Learning	Dec 1, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Learning Local Search Heuristics for Boolean Satisfiability	Dec 1, 2019	Deep Reinforcement LearningGraph Neural Network	CodeCode Available
Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Gradient Estimators for Reinforcement Learning	Dec 1, 2019	continuous-controlContinuous Control	CodeCode Available
Flow Rate Control in Smart District Heating Systems Using Deep Reinforcement Learning	Dec 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adversary A3C for Robust Reinforcement Learning	Dec 1, 2019	Atari Gamesreinforcement-learning	—Unverified
Learning Reward Machines for Partially Observable Reinforcement Learning	Dec 1, 2019	Partially Observable Reinforcement LearningProblem Decomposition	CodeCode Available

Show:10 25 50

← PrevPage 233 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified