Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1200 of 15113 papers

Title	Date	Tasks	Status	Hype
Possibility Before Utility: Learning And Using Hierarchical Affordances	Mar 23, 2022	Hierarchical Reinforcement LearningNavigate	CodeCode Available	1
Asynchronous Reinforcement Learning for Real-Time Control of Physical Robots	Mar 23, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Quantum Multi-Agent Reinforcement Learning via Variational Quantum Circuit Design	Mar 20, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	1
Teachable Reinforcement Learning via Advice Distillation	Mar 19, 2022	Decision MakingImitation Learning	CodeCode Available	1
Reinforcement learning for automatic quadrilateral mesh generation: a soft actor-critic approach	Mar 19, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
PMIC: Improving Multi-Agent Reinforcement Learning with Progressive Mutual Information Collaboration	Mar 16, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
CTDS: Centralized Teacher with Decentralized Student for Multi-Agent Reinforcement Learning	Mar 16, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Latent-Variable Advantage-Weighted Policy Optimization for Offline RL	Mar 16, 2022	continuous-controlContinuous Control	CodeCode Available	1
Zipfian environments for Reinforcement Learning	Mar 15, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
The Health Gym: Synthetic Health-Related Datasets for the Development of Reinforcement Learning Algorithms	Mar 12, 2022	BIG-bench Machine LearningGenerative Adversarial Network	CodeCode Available	1
Multi-Objective reward generalization: Improving performance of Deep Reinforcement Learning for applications in single-asset trading	Mar 9, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Curriculum-based Reinforcement Learning for Distribution System Critical Load Restoration	Mar 8, 2022	Decision Makingreinforcement-learning	CodeCode Available	1
Reliably Re-Acting to Partner's Actions with the Social Intrinsic Motivation of Transfer Empowerment	Mar 7, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning for Entity Alignment	Mar 7, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Influencing Long-Term Behavior in Multiagent Reinforcement Learning	Mar 7, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Testing Stationarity and Change Point Detection in Reinforcement Learning	Mar 3, 2022	Change Point Detectionreinforcement-learning	CodeCode Available	1
Affordance Learning from Play for Sample-Efficient Policy Learning	Mar 1, 2022	Deep Reinforcement LearningMotion Planning	CodeCode Available	1
Monkey Business: Reinforcement learning meets neighborhood search for Virtual Network Embedding	Feb 28, 2022	Network Embeddingreinforcement-learning	CodeCode Available	1
Avalanche RL: a Continual Reinforcement Learning Library	Feb 28, 2022	Continual LearningOpenAI Gym	CodeCode Available	1
Combining Modular Skills in Multitask Learning	Feb 28, 2022	Instruction Followingreinforcement-learning	CodeCode Available	1
Building a 3-Player Mahjong AI using Deep Reinforcement Learning	Feb 25, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
All You Need Is Supervised Learning: From Imitation Learning to Meta-RL With Upside Down RL	Feb 24, 2022	AllImitation Learning	CodeCode Available	1
Blockchain Framework for Artificial Intelligence Computation	Feb 23, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Using Deep Reinforcement Learning with Automatic Curriculum Learning for Mapless Navigation in Intralogistics	Feb 23, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning	Feb 23, 2022	D4RLOffline RL	CodeCode Available	1
A Comparative Study of Deep Reinforcement Learning-based Transferable Energy Management Strategies for Hybrid Electric Vehicles	Feb 22, 2022	Deep Reinforcement Learningenergy management	CodeCode Available	1
Don't Touch What Matters: Task-Aware Lipschitz Data Augmentation for Visual Reinforcement Learning	Feb 21, 2022	Data AugmentationDiversity	CodeCode Available	1
Distributed Multi-Agent Reinforcement Learning with One-hop Neighbors and Compute Straggler Mitigation	Feb 18, 2022	Distributed ComputingMulti-agent Reinforcement Learning	CodeCode Available	1
CADRE: A Cascade Deep Reinforcement Learning Framework for Vision-based Autonomous Urban Driving	Feb 17, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Open-Ended Reinforcement Learning with Neural Reward Functions	Feb 16, 2022	Montezuma's Revengereinforcement-learning	CodeCode Available	1
Soft Actor-Critic Deep Reinforcement Learning for Fault Tolerant Flight Control	Feb 16, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Graph Meta-Reinforcement Learning for Transferable Autonomous Mobility-on-Demand	Feb 15, 2022	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1
Safe Reinforcement Learning by Imagining the Near Future	Feb 15, 2022	continuous-controlContinuous Control	CodeCode Available	1
QuadSim: A Quadcopter Rotational Dynamics Simulation Framework For Reinforcement Learning Algorithms	Feb 14, 2022	OpenAI Gymreinforcement-learning	CodeCode Available	1
Supported Policy Optimization for Offline Reinforcement Learning	Feb 13, 2022	Offline RLreinforcement-learning	CodeCode Available	1
Learning by Doing: Controlling a Dynamical System using Causality, Control, and Reinforcement Learning	Feb 12, 2022	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Choices, Risks, and Reward Reports: Charting Public Policy for Reinforcement Learning Systems	Feb 11, 2022	Recommendation Systemsreinforcement-learning	CodeCode Available	1
The Shapley Value in Machine Learning	Feb 11, 2022	BIG-bench Machine LearningData Valuation	CodeCode Available	1
Reinforcement Learning with Sparse Rewards using Guidance from Offline Demonstration	Feb 9, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Rethinking Goal-conditioned Supervised Learning and Its Connection to Offline RL	Feb 9, 2022	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Contextualize Me -- The Case for Context in Reinforcement Learning	Feb 9, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Approximating Gradients for Differentiable Quality Diversity in Reinforcement Learning	Feb 8, 2022	Diversityreinforcement-learning	CodeCode Available	1
Bingham Policy Parameterization for 3D Rotations in Reinforcement Learning	Feb 8, 2022	continuous-controlContinuous Control	CodeCode Available	1
Geometric Multimodal Contrastive Representation Learning	Feb 7, 2022	Reinforcement Learning (RL)Representation Learning	CodeCode Available	1
Learning Synthetic Environments and Reward Networks for Reinforcement Learning	Feb 6, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Leveraging Approximate Symbolic Models for Reinforcement Learning via Skill Diversity	Feb 6, 2022	Diversityreinforcement-learning	CodeCode Available	1
Transfer Reinforcement Learning for Differing Action Spaces via Q-Network Representations	Feb 5, 2022	Acrobotreinforcement-learning	CodeCode Available	1
Adversarially Trained Actor Critic for Offline Reinforcement Learning	Feb 5, 2022	continuous-controlContinuous Control	CodeCode Available	1
Learning Interpretable, High-Performing Policies for Autonomous Driving	Feb 4, 2022	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
Versatile Offline Imitation from Observations and Examples via Regularized State-Occupancy Matching	Feb 4, 2022	Imitation LearningReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 24 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified