Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6001–6050 of 15113 papers

Title	Date	Tasks	Status
Learning Real-World Robot Policies by Dreaming	May 20, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning Relative Return Policies With Upside-Down Reinforcement Learning	Feb 23, 2022	reinforcement-learningReinforcement Learning	—Unverified
Learning Representations in Model-Free Hierarchical Reinforcement Learning	Oct 23, 2018	Hierarchical Reinforcement Learningmodel	—Unverified
Learning Representations in Reinforcement Learning: an Information Bottleneck Approach	Jan 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning Retrospective Knowledge with Reverse Reinforcement Learning	Jul 9, 2020	Anomaly Detectionreinforcement-learning	—Unverified
Learning Reusable Options for Multi-Task Reinforcement Learning	Jan 6, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning Reward Machines: A Study in Partially Observable Reinforcement Learning	Dec 17, 2021	Partially Observable Reinforcement LearningProblem Decomposition	—Unverified
Learning Rewards to Optimize Global Performance Metrics in Deep Reinforcement Learning	Mar 16, 2023	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Learning Robotic Assembly from CAD	Mar 20, 2018	Contact-rich ManipulationMotion Planning	—Unverified
Learning Robotic Manipulation Skills Using an Adaptive Force-Impedance Action Space	Oct 19, 2021	Contact-rich ManipulationDecision Making	—Unverified
Learning Robot Soccer from Egocentric Vision with Deep Reinforcement Learning	May 3, 2024	Deep Reinforcement LearningObject Tracking	—Unverified
Learning Robust Autonomous Navigation and Locomotion for Wheeled-Legged Robots	May 3, 2024	Autonomous NavigationNavigate	—Unverified
Learning Robust Controllers Via Probabilistic Model-Based Policy Search	Oct 26, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Learning Robust Rewards with Adverserial Inverse Reinforcement Learning	Jan 1, 2018	Decision MakingDeep Reinforcement Learning	—Unverified
Learning Routines for Effective Off-Policy Reinforcement Learning	Jun 5, 2021	Computational Efficiencyreinforcement-learning	—Unverified
Learning Runtime Parameters in Computer Systems with Delayed Experience Injection	Oct 31, 2016	CPUDeep Reinforcement Learning	—Unverified
Learning Safe Policies with Cost-sensitive Advantage Estimation	Jan 1, 2021	Reinforcement Learning (RL)	—Unverified
Learning Safe Policies with Expert Guidance	May 21, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning safety critics via a non-contractive binary bellman operator	Jan 23, 2024	Reinforcement Learning (RL)	—Unverified
Learning Sampling Policy for Faster Derivative Free Optimization	Apr 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Learning Security Strategies through Game Play and Optimal Stopping	May 29, 2022	reinforcement-learningReinforcement Learning	—Unverified
Learning Self-Game-Play Agents for Combinatorial Optimization Problems	Mar 8, 2019	Atari GamesBoard Games	—Unverified
Learning Shaping Strategies in Human-in-the-loop Interactive Reinforcement Learning	Nov 10, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning Shared Representations in Multi-task Reinforcement Learning	Mar 7, 2016	reinforcement-learningReinforcement Learning	—Unverified
Learning Soft Driving Constraints from Vectorized Scene Embeddings while Imitating Expert Trajectories	Dec 7, 2024	Imitation LearningMotion Planning	—Unverified
Learning Sparse Representations in Reinforcement Learning with Sparse Coding	Jul 26, 2017	reinforcement-learningReinforcement Learning	—Unverified
Learning sparse representations in reinforcement learning	Sep 4, 2019	Acrobotreinforcement-learning	—Unverified
Learning Sparse Representations Incrementally in Deep Reinforcement Learning	Dec 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning State Representations for Query Optimization with Deep Reinforcement Learning	Mar 22, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning State Representations in Complex Systems with Multimodal Data	Nov 27, 2018	Anomaly DetectionDisentanglement	—Unverified
Learning State Representations via Temporal Cycle-Consistency Constraint in Model-Based Reinforcement Learning	Mar 9, 2021	continuous-controlContinuous Control	—Unverified
Learning Strategic Language Agents in the Werewolf Game with Iterative Latent Space Policy Optimization	Feb 7, 2025	counterfactualDecision Making	—Unverified
Learning Structured Communication for Multi-agent Reinforcement Learning	Feb 11, 2020	Graph Neural NetworkMulti-agent Reinforcement Learning	—Unverified
Learning swimming escape patterns for larval fish under energy constraints	May 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learning Symbolic Representations for Reinforcement Learning of Non-Markovian Behavior	Jan 8, 2023	reinforcement-learningReinforcement Learning	—Unverified
Learning Symbolic Rules for Interpretable Deep Reinforcement Learning	Mar 15, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning Task Automata for Reinforcement Learning using Hidden Markov Models	Aug 25, 2022	reinforcement-learningReinforcement Learning	—Unverified
Learning Task-Driven Control Policies via Information Bottlenecks	Feb 4, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning Task Informed Abstractions	Mar 9, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Learning Task-Relevant Representations with Selective Contrast for Reinforcement Learning in a Real-World Application	Jun 13, 2021	Contrastive Learningreinforcement-learning	—Unverified
Learning Task Sampling Policy for Multitask Learning	Nov 1, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Learning Temporal Abstraction with Information-theoretic Constraints for Hierarchical Reinforcement Learning	Sep 25, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Learning Temporally Extended Skills in Continuous Domains as Symbolic Actions for Planning	Jul 11, 2022	continuous-controlContinuous Control	—Unverified
Learning Temporal Point Processes via Reinforcement Learning	Nov 12, 2018	Point Processesreinforcement-learning	—Unverified
Learning the Arrow of Time for Problems in Reinforcement Learning	May 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning the Extraction Order of Multiple Relational Facts in a Sentence with Reinforcement Learning	Nov 1, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning the model-free linear quadratic regulator via random search	Jun 8, 2020	Reinforcement Learning (RL)	—Unverified
Learning the policy for mixed electric platoon control of automated and human-driven vehicles at signalized intersection: a random search approach	Jun 24, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Learning the Target Network in Function Space	Jun 3, 2024	Reinforcement Learning (RL)	—Unverified
Learning through Probing: a decentralized reinforcement learning architecture for social dilemmas	Sep 26, 2018	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 121 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified