Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6101–6125 of 15113 papers

Title	Date	Tasks	Status
Learning to Grasp the Ungraspable with Emergent Extrinsic Dexterity	Nov 2, 2022	FrictionObject	—Unverified
Learning to grow: control of material self-assembly using evolutionary reinforcement learning	Dec 18, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning to Guide a Saturation-Based Theorem Prover	Jun 7, 2021	Automated Theorem ProvingGraph Neural Network	—Unverified
Learning to Guide Multiple Heterogeneous Actors from a Single Human Demonstration via Automatic Curriculum Learning in StarCraft II	May 11, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning to Herd Agents Amongst Obstacles: Training Robust Shepherding Behaviors using Deep Reinforcement Learning	May 19, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Learning to Infer Unseen Contexts in Causal Contextual Reinforcement Learning	Mar 9, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learning to Influence Human Behavior with Offline Reinforcement Learning	Mar 3, 2023	Autonomous DrivingOffline RL	—Unverified
Learning to Interrupt: A Hierarchical Deep Reinforcement Learning Framework for Efficient Exploration	Jul 30, 2018	Deep Reinforcement LearningEfficient Exploration	—Unverified
Learning to Learn: Meta-Critic Networks for Sample Efficient Learning	Jun 29, 2017	Meta-Learningreinforcement-learning	—Unverified
Learning to Locomote: Understanding How Environment Design Matters for Deep Reinforcement Learning	Oct 9, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning to Locomote with Deep Neural-Network and CPG-based Control in a Soft Snake Robot	Jan 13, 2020	Deep Reinforcement LearningReinforcement Learning	—Unverified
Learning to Minimize Age of Information over an Unreliable Channel with Energy Harvesting	Jun 30, 2021	Reinforcement Learning (RL)Scheduling	—Unverified
Learning to Mitigate AI Collusion on Economic Platforms	Feb 15, 2022	reinforcement-learningReinforcement Learning	—Unverified
Learning to Mix n-Step Returns: Generalizing lambda-Returns for Deep Reinforcement Learning	May 21, 2017	BenchmarkingDecision Making	—Unverified
Learning to Navigate the Web	Dec 21, 2018	Deep Reinforcement LearningInstruction Following	—Unverified
Learning to Observe with Reinforcement Learning	Jan 1, 2021	Decision Makingreinforcement-learning	—Unverified
Learning to Operate an Electric Vehicle Charging Station Considering Vehicle-grid Integration	Nov 1, 2021	Model Predictive Controlreinforcement-learning	—Unverified
Learning to Operate in Open Worlds by Adapting Planning Models	Mar 24, 2023	Reinforcement Learning (RL)	—Unverified
Learning to Optimize	Jun 6, 2016	reinforcement-learningReinforcement Learning	—Unverified
Learning to Optimize LSM-trees: Towards A Reinforcement Learning based Key-Value Store for Dynamic Workloads	Aug 14, 2023	Reinforcement Learning (RL)	—Unverified
Learning to Optimize Neural Nets	Mar 1, 2017	reinforcement-learningReinforcement Learning	—Unverified
Learning to Optimize Permutation Flow Shop Scheduling via Graph-based Imitation Learning	Oct 31, 2022	Computational EfficiencyImitation Learning	—Unverified
Learning to Order Sub-questions for Complex Question Answering	Nov 11, 2019	Question AnsweringReinforcement Learning	—Unverified
Learning to Perform Physics Experiments via Deep Reinforcement Learning	Nov 6, 2016	Deep Reinforcement LearningFriction	—Unverified
Learning to Plan via Deep Optimistic Value Exploration	Jun 8, 2020	BenchmarkingModel-based Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 245 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified