Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1401–1425 of 15113 papers

Title	Date	Tasks	Status	Hype
Vision-Based Autonomous Car Racing Using Deep Imitative Reinforcement Learning	Jul 18, 2021	Autonomous DrivingAutonomous Racing	CodeCode Available	1
Co-designing Intelligent Control of Building HVACs and Microgrids	Jul 18, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Megaverse: Simulating Embodied Agents at One Million Experiences per Second	Jul 17, 2021	GPUReinforcement Learning (RL)	CodeCode Available	1
Reinforcement Learning for Adaptive Optimal Stationary Control of Linear Stochastic Systems	Jul 16, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
A Reinforcement Learning Environment for Mathematical Reasoning via Program Synthesis	Jul 15, 2021	Mathematical ReasoningProgram Synthesis	CodeCode Available	1
Surgical Instruction Generation with Transformers	Jul 14, 2021	DecoderMachine Translation	CodeCode Available	1
ReLLIE: Deep Reinforcement Learning for Customized Low-Light Image Enhancement	Jul 13, 2021	Deep Reinforcement LearningImage Enhancement	CodeCode Available	1
Teaching Agents how to Map: Spatial Reasoning for Multi-Object Navigation	Jul 13, 2021	Reinforcement Learning (RL)Spatial Reasoning	CodeCode Available	1
Shortest-Path Constrained Reinforcement Learning for Sparse Reward Tasks	Jul 13, 2021	continuous-controlContinuous Control	CodeCode Available	1
Conservative Offline Distributional Reinforcement Learning	Jul 12, 2021	D4RLDistributional Reinforcement Learning	CodeCode Available	1
Explore and Control with Adversarial Surprise	Jul 12, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Towards Better Laplacian Representation in Reinforcement Learning with Generalized Graph Drawing	Jul 12, 2021	continuous-controlContinuous Control	CodeCode Available	1
Out-of-Distribution Dynamics Detection: RL-Relevant Benchmarks and Results	Jul 11, 2021	Reinforcement Learning (RL)Time Series	CodeCode Available	1
Backprop-Free Reinforcement Learning with Active Neural Generative Coding	Jul 10, 2021	Q-Learningreinforcement-learning	CodeCode Available	1
BayesSimIG: Scalable Parameter Inference for Adaptive Domain Randomization with IsaacGym	Jul 9, 2021	GPUReinforcement Learning (RL)	CodeCode Available	1
Learning Vision-Guided Quadrupedal Locomotion End-to-End with Cross-Modal Transformers	Jul 8, 2021	Reinforcement Learning (RL)	CodeCode Available	1
Offline Meta-Reinforcement Learning with Online Self-Supervision	Jul 8, 2021	Meta Reinforcement LearningOffline RL	CodeCode Available	1
Distributed Online Service Coordination Using Deep Reinforcement Learning	Jul 7, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Multi-Modal Mutual Information (MuMMI) Training for Robust Self-Supervised Deep Reinforcement Learning	Jul 6, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
THE SJTU SYSTEM FOR DCASE2021 CHALLENGE TASK 6: AUDIO CAPTIONING BASED ON ENCODER PRE-TRAINING AND REINFORCEMENT LEARNING	Jul 6, 2021	Audio captioningAudio Tagging	CodeCode Available	1
AdaRL: What, Where, and How to Adapt in Transfer Reinforcement Learning	Jul 6, 2021	Atari Gamesreinforcement-learning	CodeCode Available	1
Agents that Listen: High-Throughput Reinforcement Learning with Multiple Sensory Systems	Jul 5, 2021	Game of Doomreinforcement-learning	CodeCode Available	1
Sample Efficient Reinforcement Learning via Model-Ensemble Exploration and Exploitation	Jul 5, 2021	continuous-controlContinuous Control	CodeCode Available	1
Mava: a research library for distributed multi-agent reinforcement learning in JAX	Jul 3, 2021	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available	1
Systematic Evaluation of Causal Discovery in Visual Model Based Reinforcement Learning	Jul 2, 2021	BenchmarkingCausal Discovery	CodeCode Available	1

Show:10 25 50

← PrevPage 57 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified