Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5876–5900 of 15113 papers

Title	Date	Tasks	Status
Learning Dynamic State Abstractions for Model-Based Reinforcement Learning	Jan 1, 2018	Atari GamesDecision Making	—Unverified
Learning Eco-Driving Strategies at Signalized Intersections	Apr 26, 2022	Autonomous VehiclesReinforcement Learning (RL)	—Unverified
Learning Efficient Multi-Agent Cooperative Visual Exploration	Oct 12, 2021	Reinforcement Learning (RL)Visual Navigation	—Unverified
Learning Efficient Navigation in Vortical Flow Fields	Feb 21, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learning Efficient Parameter Server Synchronization Policies for Distributed SGD	May 1, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Learning Efficient Planning-based Rewards for Imitation Learning	Jan 1, 2021	Atari Gamescontinuous-control	—Unverified
Learning Efficient Recursive Numeral Systems via Reinforcement Learning	Sep 11, 2024	reinforcement-learningReinforcement Learning	—Unverified
Learning Efficient Representations for Reinforcement Learning	Aug 28, 2015	Decision Makingreinforcement-learning	—Unverified
Learning Elimination Ordering for Tree Decomposition Problem	Oct 17, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning Emergence of Interaction Patterns across Independent RL Agents in Multi-Agent Environments	Oct 3, 2024	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Learning Emergent Discrete Message Communication for Cooperative Reinforcement Learning	Feb 24, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Learning-Enhanced Safeguard Control for High-Relative-Degree Systems: Robust Optimization under Disturbances and Faults	Jan 26, 2025	Reinforcement Learning (RL)Safe Exploration	—Unverified
Learning Equational Theorem Proving	Feb 10, 2021	Automated Theorem ProvingDeep Reinforcement Learning	—Unverified
Learning Exploration Policies for Model-Agnostic Meta-Reinforcement Learning	May 16, 2019	Efficient ExplorationMeta Reinforcement Learning	—Unverified
Learning Extreme Hummingbird Maneuvers on Flapping Wing Robots	Feb 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning Fair Policies in Multi-Objective (Deep) Reinforcement Learning with Average and Discounted Rewards	Jan 1, 2020	Deep Reinforcement LearningFairness	—Unverified
Learning fast changing slow in spiking neural networks	Jan 25, 2024	Reinforcement Learning (RL)	—Unverified
Learning First-to-Spike Policies for Neuromorphic Control Using Policy Gradients	Oct 23, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified
LearningFlow: Automated Policy Learning Workflow for Urban Driving with Large Language Models	Jan 9, 2025	Autonomous DrivingLarge Language Model	—Unverified
Learning Force Control for Legged Manipulation	May 2, 2024	Reinforcement Learning (RL)	—Unverified
Learning for Visual Navigation by Imagining the Success	Feb 28, 2021	NavigateReinforcement Learning (RL)	—Unverified
Learning from Atypical Behavior: Temporary Interest Aware Recommendation Based on Reinforcement Learning	Jan 16, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Learning from Demonstrations using Signal Temporal Logic	Feb 15, 2021	OpenAI Gymreinforcement-learning	—Unverified
Learning from Demonstrations with Energy based Generative Adversarial Imitation Learning	Jan 1, 2021	Imitation Learningreinforcement-learning	—Unverified
Learning from Good Trajectories in Offline Multi-Agent Reinforcement Learning	Nov 28, 2022	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 236 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified