Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8726–8750 of 15113 papers

Title	Date	Tasks	Status
Winning at Any Cost -- Infringing the Cartel Prohibition With Reinforcement Learning	Jul 5, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Gradient Importance Learning for Incomplete Observations	Jul 5, 2021	ImputationMissing Values	CodeCode Available
A Review of Explainable Artificial Intelligence in Manufacturing	Jul 5, 2021	Decision MakingExplainable artificial intelligence	—Unverified
Ensemble and Auxiliary Tasks for Data-Efficient Deep Reinforcement Learning	Jul 5, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available
Control of rough terrain vehicles using deep reinforcement learning	Jul 5, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Low Dimensional State Representation Learning with Robotics Priors in Continuous Action Spaces	Jul 4, 2021	reinforcement-learningReinforcement Learning	—Unverified
Low-Dimensional State and Action Representation Learning with MDP Homomorphism Metrics	Jul 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Restless and Uncertain: Robust Policies for Restless Bandits via Deep Multi-Agent Reinforcement Learning	Jul 4, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Traffic Signal Control with Communicative Deep Reinforcement Learning Agents: a Case Study	Jul 3, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Optimality Inductive Biases and Agnostic Guidelines for Offline Reinforcement Learning	Jul 3, 2021	AttributeInductive Bias	CodeCode Available
Examining average and discounted reward optimality criteria in reinforcement learning	Jul 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
Controlled Interacting Particle Algorithms for Simulation-based Reinforcement Learning	Jul 2, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
A Novel Deep Reinforcement Learning Based Stock Direction Prediction using Knowledge Graph and Community Aware Sentiments	Jul 2, 2021	Deep Reinforcement LearningPrediction	—Unverified
Beyond Value-Function Gaps: Improved Instance-Dependent Regret Bounds for Episodic Reinforcement Learning	Jul 2, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning for Feedback-Enabled Cyber Resilience	Jul 2, 2021	Intrusion Detectionreinforcement-learning	—Unverified
RL-NCS: Reinforcement learning based data-driven approach for nonuniform compressed sensing	Jul 2, 2021	compressed sensingreinforcement-learning	CodeCode Available
SocialAI: Benchmarking Socio-Cognitive Abilities in Deep Reinforcement Learning Agents	Jul 2, 2021	BenchmarkingDeep Reinforcement Learning	—Unverified
Optimal Power Allocation for Rate Splitting Communications with Deep Reinforcement Learning	Jul 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
MHER: Model-based Hindsight Experience Replay	Jul 1, 2021	modelMulti-Goal Reinforcement Learning	—Unverified
Model Mediated Teleoperation with a Hand-Arm Exoskeleton in Long Time Delays Using Reinforcement Learning	Jul 1, 2021	Reinforcement Learning (RL)	—Unverified
Blending Task Success and User Satisfaction: Analysis of Learned Dialogue Behaviour with Multiple Rewards	Jul 1, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Goal-Conditioned Reinforcement Learning with Imagined Subgoals	Jul 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Inverse Reinforcement Learning Based Stochastic Driver Behavior Learning	Jul 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Decomposing the Prediction Problem; Autonomous Navigation by neoRL Agents	Jun 30, 2021	Autonomous NavigationPrediction	—Unverified
Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in Edge Industrial IoT	Jun 30, 2021	Decision MakingEdge-computing	—Unverified

Show:10 25 50

← PrevPage 350 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified