Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5826–5850 of 15113 papers

Title	Date	Tasks	Status
Learning to Communicate with Intent: An Introduction	Nov 17, 2022	Reinforcement Learning (RL)	—Unverified
A Reinforcement Learning Approach for Process Parameter Optimization in Additive Manufacturing	Nov 17, 2022	Q-Learningreinforcement-learning	—Unverified
DexPoint: Generalizable Point Cloud Reinforcement Learning for Sim-to-Real Dexterous Manipulation	Nov 17, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
AlphaSnake: Policy Iteration on a Nondeterministic NP-hard Markov Decision Process	Nov 17, 2022	reinforcement-learningReinforcement Learning	—Unverified
Planning Irregular Object Packing via Hierarchical Reinforcement Learning	Nov 17, 2022	Hierarchical Reinforcement LearningObject	—Unverified
Solar Power driven EV Charging Optimization with Deep Reinforcement Learning	Nov 17, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reward Gaming in Conditional Text Generation	Nov 16, 2022	Conditional Text GenerationReinforcement Learning (RL)	—Unverified
Model Based Residual Policy Learning with Applications to Antenna Control	Nov 16, 2022	Reinforcement Learning (RL)	—Unverified
Minimum information divergence of Q-functions for dynamic treatment resumes	Nov 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Addressing the issue of stochastic environments and local decision-making in multi-objective reinforcement learning	Nov 16, 2022	Decision MakingMulti-Objective Reinforcement Learning	—Unverified
Data-pooling Reinforcement Learning for Personalized Healthcare Intervention	Nov 16, 2022	Decision MakingManagement	—Unverified
General Intelligence Requires Rethinking Exploration	Nov 15, 2022	reinforcement-learningReinforcement Learning	—Unverified
Explainable Action Advising for Multi-Agent Reinforcement Learning	Nov 15, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Agent-State Construction with Auxiliary Inputs	Nov 15, 2022	Decision Makingreinforcement-learning	CodeCode Available
Contextual Transformer for Offline Meta Reinforcement Learning	Nov 15, 2022	D4RLMeta Reinforcement Learning	—Unverified
APT: Adaptive Perceptual quality based camera Tuning using reinforcement learning	Nov 15, 2022	object-detectionObject Detection	—Unverified
Universal Distributional Decision-based Black-box Adversarial Attack with Reinforcement Learning	Nov 15, 2022	Adversarial Attackreinforcement-learning	—Unverified
Reinforcement Learning Methods for Wordle: A POMDP/Adaptive Control Approach	Nov 15, 2022	reinforcement-learningReinforcement Learning	—Unverified
Offline Reinforcement Learning with Adaptive Behavior Regularization	Nov 15, 2022	D4RLOffline RL	—Unverified
Reinforcement Learning Based Resource Allocation for Network Slices in O-RAN Midhaul	Nov 14, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
(When) Are Contrastive Explanations of Reinforcement Learning Helpful?	Nov 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Parallel Automatic History Matching Algorithm Using Reinforcement Learning	Nov 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
NeurIPS 2022 Competition: Driving SMARTS	Nov 14, 2022	Autonomous DrivingReinforcement Learning (RL)	—Unverified
Linear Reinforcement Learning with Ball Structure Action Space	Nov 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Hierarchically Structured Task-Agnostic Continual Learning	Nov 14, 2022	Continual Learningreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 234 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified