Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1551–1575 of 15113 papers

Title	Date	Tasks	Status	Hype
Comparing Popular Simulation Environments in the Scope of Robotics and Reinforcement Learning	Mar 8, 2021	CPUreinforcement-learning	CodeCode Available	1
Learning to swim in potential flow	Sep 30, 2020	Motion Planningreinforcement-learning	CodeCode Available	1
Combinatorial Optimization with Policy Adaptation using Latent Space Search	Nov 13, 2023	BenchmarkingCombinatorial Optimization	CodeCode Available	1
Learning to Walk by Steering: Perceptive Quadrupedal Locomotion in Dynamic Environments	Sep 19, 2022	Decision MakingImitation Learning	CodeCode Available	1
Agent-Temporal Attention for Reward Redistribution in Episodic Multi-Agent Reinforcement Learning	Jan 12, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Learning Trajectories for Visual-Inertial System Calibration via Model-based Heuristic Deep Reinforcement Learning	Nov 4, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
An Equivalence between Loss Functions and Non-Uniform Sampling in Experience Replay	Jul 12, 2020	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
Learning When and Where to Zoom with Deep Reinforcement Learning	Mar 1, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
LEDRO: LLM-Enhanced Design Space Reduction and Optimization for Analog Circuits	Nov 19, 2024	Bayesian OptimizationReinforcement Learning (RL)	CodeCode Available	1
Towards Real-World Deployment of Reinforcement Learning for Traffic Signal Control	Mar 30, 2021	CPUOpenAI Gym	CodeCode Available	1
Combining Deep Reinforcement Learning and Search for Imperfect-Information Games	Jul 27, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Let Offline RL Flow: Training Conservative Agents in the Latent Space of Normalizing Flows	Nov 20, 2022	Offline RLreinforcement-learning	CodeCode Available	1
Collision Probability Distribution Estimation via Temporal Difference Learning	Jul 29, 2024	AI AgentAutonomous Driving	CodeCode Available	1
Leveraging Factored Action Spaces for Efficient Offline Reinforcement Learning in Healthcare	May 2, 2023	Offline RLreinforcement-learning	CodeCode Available	1
Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration	Oct 23, 2024	Efficient ExplorationReinforcement Learning (RL)	CodeCode Available	1
Leveraging Symmetry to Accelerate Learning of Trajectory Tracking Controllers for Free-Flying Robotic Systems	Sep 17, 2024	Reinforcement Learning (RL)	CodeCode Available	1
Abstract-to-Executable Trajectory Translation for One-Shot Task Generalization	Oct 14, 2022	Few-Shot Imitation LearningReinforcement Learning (RL)	CodeCode Available	1
Lifelong Machine Learning of Functionally Compositional Structures	Jul 25, 2022	BIG-bench Machine LearningContinual Learning	CodeCode Available	1
Light-weight probing of unsupervised representations for Reinforcement Learning	Aug 25, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
LIIR: Learning Individual Intrinsic Reward in Multi-Agent Reinforcement Learning	Dec 1, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Combinatorial Optimization by Graph Pointer Networks and Hierarchical Reinforcement Learning	Nov 12, 2019	Combinatorial OptimizationGraph Embedding	CodeCode Available	1
Learning to combine primitive skills: A step towards versatile robotic manipulation	Aug 2, 2019	Data AugmentationImitation Learning	CodeCode Available	1
LOA: Logical Optimal Actions for Text-based Interaction Games	Oct 21, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Local policy search with Bayesian optimization	Jun 22, 2021	Bayesian OptimizationReinforcement Learning (RL)	CodeCode Available	1
Collaborative Multi-Agent Dialogue Model Training Via Reinforcement Learning	Jul 11, 2019	Natural Language Understandingreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 63 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified