Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11401–11450 of 15113 papers

Title	Date	Tasks	Status	Hype
Measuring the Reliability of Reinforcement Learning Algorithms	Dec 10, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Deep RL-based Trajectory Planning for AoI Minimization in UAV-assisted IoT	Dec 9, 2019	Decision MakingDeep Reinforcement Learning	—Unverified	0
Exploratory Not Explanatory: Counterfactual Analysis of Saliency Maps for Deep Reinforcement Learning	Dec 9, 2019	Atari Gamescounterfactual	—Unverified	0
Learning to Code: Coded Caching via Deep Reinforcement Learning	Dec 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning Latent State Spaces for Planning through Reward Prediction	Dec 9, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Efficient Object Detection in Large Images using Deep Reinforcement Learning	Dec 9, 2019	Deep Reinforcement Learningobject-detection	CodeCode Available	0
Intelligent Coordination among Multiple Traffic Intersections Using Multi-Agent Reinforcement Learning	Dec 9, 2019	AI AgentMulti-agent Reinforcement Learning	—Unverified	0
Decentralized Multi-Agent Reinforcement Learning with Networked Agents: Recent Advances	Dec 9, 2019	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
ChainerRL: A Deep Reinforcement Learning Library	Dec 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning Sparse Representations Incrementally in Deep Reinforcement Learning	Dec 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Optimism in Reinforcement Learning with Generalized Linear Function Approximation	Dec 9, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Unsupervised Curricula for Visual Meta-Reinforcement Learning	Dec 9, 2019	ClusteringMeta-Learning	—Unverified	0
Transformer Based Reinforcement Learning For Games	Dec 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Effects of a Social Force Model reward in Robot Navigation based on Deep Reinforcement Learning	Dec 8, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
Increasing performance of electric vehicles in ride-hailing services using deep reinforcement learning	Dec 7, 2019	Autonomous VehiclesDecision Making	CodeCode Available	0
Hierarchical Cooperative Multi-Agent Reinforcement Learning with Skill Discovery	Dec 7, 2019	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	0
From Reinforcement Learning to Optimal Control: A unified framework for sequential decisions	Dec 7, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
No-Regret Exploration in Goal-Oriented Reinforcement Learning	Dec 7, 2019	Atari Gamesreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Routing a Heterogeneous Fleet of Vehicles	Dec 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A pedestrian path-planning model in accordance with obstacle's danger with reinforcement learning	Dec 6, 2019	Collision Avoidancereinforcement-learning	—Unverified	0
Alternative Function Approximation Parameterizations for Solving Games: An Analysis of f-Regression Counterfactual Regret Minimization	Dec 6, 2019	counterfactualregression	—Unverified	0
How Does an Approximate Model Help in Reinforcement Learning?	Dec 6, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Observational Overfitting in Reinforcement Learning	Dec 6, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
VALAN: Vision and Language Agent Navigation	Dec 6, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Making Smart Homes Smarter: Optimizing Energy Consumption with Human in the Loop	Dec 6, 2019	ClusteringReinforcement Learning	—Unverified	0
Reinforcement Learning with Convolutional Reservoir Computing	Dec 5, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Scalable Reinforcement Learning for Multi-Agent Networked Systems	Dec 5, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning Upside Down: Don't Predict Rewards -- Just Map Them to Actions	Dec 5, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Training Agents using Upside-Down Reinforcement Learning	Dec 5, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Reinforcement Learning with Non-Markovian Rewards	Dec 5, 2019	Q-Learningreinforcement-learning	—Unverified	0
Dynamic Pricing on E-commerce Platform with Deep Reinforcement Learning: A Field Experiment	Dec 5, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Inter-Level Cooperation in Hierarchical Reinforcement Learning	Dec 5, 2019	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	0
Hindsight Credit Assignment	Dec 5, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Blind Inpainting of Large-scale Masks of Thin Structures with Adversarial and Reinforcement Learning	Dec 5, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Iterative Policy-Space Expansion in Reinforcement Learning	Dec 5, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Simplified Action Decoder for Deep Multi-Agent Reinforcement Learning	Dec 4, 2019	DecoderMulti-agent Reinforcement Learning	CodeCode Available	1
Deep Model Compression Via Two-Stage Deep Reinforcement Learning	Dec 4, 2019	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Reinforcement learning for bandwidth estimation and congestion control in real-time communications	Dec 4, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
AlgaeDICE: Policy Gradient from Arbitrary Experience	Dec 4, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Optimal Policies Tend to Seek Power	Dec 3, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Mo' States Mo' Problems: Emergency Stop Mechanisms from Observation	Dec 3, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Self-Learned Formula Synthesis in Set Theory	Dec 3, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
SafeLife 1.0: Exploring Side Effects in Complex Environments	Dec 3, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Neighborhood Cognition Consistent Multi-Agent Reinforcement Learning	Dec 3, 2019	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
Dream to Control: Learning Behaviors by Latent Imagination	Dec 3, 2019	Continuous Controlreinforcement-learning	CodeCode Available	1
Leveraging Procedural Generation to Benchmark Reinforcement Learning	Dec 3, 2019	Procgen Hard (100M)reinforcement-learning	CodeCode Available	2
Human-Robot Collaboration via Deep Reinforcement Learning of Real-World Interactions	Dec 2, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Just Ask:An Interactive Learning Framework for Vision and Language Navigation	Dec 2, 2019	Continual LearningData Augmentation	—Unverified	0
Policy Optimization Reinforcement Learning with Entropy Regularization	Dec 2, 2019	Continuous Controlreinforcement-learning	—Unverified	0
Flow Rate Control in Smart District Heating Systems Using Deep Reinforcement Learning	Dec 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 229 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified