Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7826–7850 of 15113 papers

Title	Date	Tasks	Status	Hype
THE SJTU SYSTEM FOR DCASE2021 CHALLENGE TASK 6: AUDIO CAPTIONING BASED ON ENCODER PRE-TRAINING AND REINFORCEMENT LEARNING	Jul 6, 2021	Audio captioningAudio Tagging	CodeCode Available	1
Meta-Reinforcement Learning for Heuristic Planning	Jul 6, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Multi-Modal Mutual Information (MuMMI) Training for Robust Self-Supervised Deep Reinforcement Learning	Jul 6, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
A Unified Off-Policy Evaluation Approach for General Value Function	Jul 6, 2021	Anomaly DetectionOff-policy evaluation	—Unverified	0
A Short Note on the Relationship of Information Gain and Eluder Dimension	Jul 6, 2021	LEMMAreinforcement-learning	—Unverified	0
AdaRL: What, Where, and How to Adapt in Transfer Reinforcement Learning	Jul 6, 2021	Atari Gamesreinforcement-learning	CodeCode Available	1
Gradient Importance Learning for Incomplete Observations	Jul 5, 2021	ImputationMissing Values	CodeCode Available	0
Control of rough terrain vehicles using deep reinforcement learning	Jul 5, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Ensemble and Auxiliary Tasks for Data-Efficient Deep Reinforcement Learning	Jul 5, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
A Review of Explainable Artificial Intelligence in Manufacturing	Jul 5, 2021	Decision MakingExplainable artificial intelligence	—Unverified	0
Agents that Listen: High-Throughput Reinforcement Learning with Multiple Sensory Systems	Jul 5, 2021	Game of Doomreinforcement-learning	CodeCode Available	1
The Least Restriction for Offline Reinforcement Learning	Jul 5, 2021	Offline RLQ-Learning	—Unverified	0
Winning at Any Cost -- Infringing the Cartel Prohibition With Reinforcement Learning	Jul 5, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Sample Efficient Reinforcement Learning via Model-Ensemble Exploration and Exploitation	Jul 5, 2021	continuous-controlContinuous Control	CodeCode Available	1
Low Dimensional State Representation Learning with Robotics Priors in Continuous Action Spaces	Jul 4, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Low-Dimensional State and Action Representation Learning with MDP Homomorphism Metrics	Jul 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Restless and Uncertain: Robust Policies for Restless Bandits via Deep Multi-Agent Reinforcement Learning	Jul 4, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Traffic Signal Control with Communicative Deep Reinforcement Learning Agents: a Case Study	Jul 3, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Optimality Inductive Biases and Agnostic Guidelines for Offline Reinforcement Learning	Jul 3, 2021	AttributeInductive Bias	CodeCode Available	0
Mava: a research library for distributed multi-agent reinforcement learning in JAX	Jul 3, 2021	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available	1
Examining average and discounted reward optimality criteria in reinforcement learning	Jul 3, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Beyond Value-Function Gaps: Improved Instance-Dependent Regret Bounds for Episodic Reinforcement Learning	Jul 2, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Controlled Interacting Particle Algorithms for Simulation-based Reinforcement Learning	Jul 2, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
RL-NCS: Reinforcement learning based data-driven approach for nonuniform compressed sensing	Jul 2, 2021	compressed sensingreinforcement-learning	CodeCode Available	0
Reinforcement Learning for Feedback-Enabled Cyber Resilience	Jul 2, 2021	Intrusion Detectionreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 314 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified