Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6151–6175 of 15113 papers

Title	Date	Tasks	Status
Learning to Scan: A Deep Reinforcement Learning Approach for Personalized Scanning in CT Imaging	Jun 3, 2020	compressed sensingComputed Tomography (CT)	—Unverified
Learning to Schedule Heuristics for the Simultaneous Stochastic Optimization of Mining Complexes	Nov 24, 2021	Combinatorial OptimizationReinforcement Learning (RL)	—Unverified
Learning to schedule job-shop problems: Representation and policy learning using graph neural network and reinforcement learning	Jun 2, 2021	Decision MakingGraph Neural Network	—Unverified
Learning to Select the Next Reasonable Mention for Entity Linking	Dec 8, 2021	Entity LinkingKnowledge Graphs	—Unverified
Learning to Shape Rewards using a Game of Two Partners	Mar 16, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learning to Shoot in First Person Shooter Games by Stabilizing Actions and Clustering Rewards for Reinforcement Learning	Jun 13, 2018	Board GamesClustering	—Unverified
Learning to Sit: Synthesizing Human-Chair Interactions via Hierarchical Control	Aug 20, 2019	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
Learning to solve arithmetic problems with a virtual abacus	Jan 17, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning To Solve Circuit-SAT: An Unsupervised Differentiable Approach	May 1, 2019	Combinatorial Optimizationreinforcement-learning	—Unverified
Learning to Optimise Climate Sensor Placement using a Transformer	Oct 18, 2023	Deep Reinforcement LearningManagement	—Unverified
Learning to Solve Combinatorial Problems via Efficient Exploration	Sep 29, 2021	Efficient ExplorationReinforcement Learning (RL)	—Unverified
Learning to superoptimize programs - Workshop Version	Dec 4, 2016	reinforcement-learningReinforcement Learning	—Unverified
Learning to Switch Among Agents in a Team via 2-Layer Markov Decision Processes	Feb 11, 2020	Autonomous Drivingreinforcement-learning	—Unverified
Learning to Teach in Cooperative Multiagent Reinforcement Learning	May 20, 2018	reinforcement-learningReinforcement Learning	—Unverified
Learning to Teach Reinforcement Learning Agents	Jul 28, 2017	reinforcement-learningReinforcement Learning	—Unverified
Learning to Transfer Learn: Reinforcement Learning-Based Selection for Adaptive Transfer Learning	Aug 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning to Transfer Role Assignment Across Team Sizes	Apr 17, 2022	ManagementMulti-agent Reinforcement Learning	—Unverified
Learning to Treat Sepsis with Multi-Output Gaussian Process Deep Recurrent Q-Networks	Jan 1, 2018	Deep Reinforcement LearningGaussian Processes	—Unverified
Learning to Unknot	Oct 28, 2020	Binary ClassificationReinforcement Learning (RL)	—Unverified
Learning to Utilize Shaping Rewards: A New Approach of Reward Shaping	Nov 5, 2020	MuJoCoReinforcement Learning (RL)	—Unverified
Learning to View: Decision Transformers for Active Object Detection	Jan 23, 2023	Active Object DetectionMotion Planning	—Unverified
Learning to Walk: Spike Based Reinforcement Learning for Hexapod Robot Central Pattern Generation	Mar 22, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning to Walk via Deep Reinforcement Learning	Dec 26, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning Transferable Domain Priors for Safe Exploration in Reinforcement Learning	Sep 10, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning Transition Models with Time-delayed Causal Relations	Aug 4, 2020	Model-based Reinforcement Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 247 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified