Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1401–1450 of 15113 papers

Title	Date	Tasks	Status	Hype
Co-designing Intelligent Control of Building HVACs and Microgrids	Jul 18, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Vision-Based Autonomous Car Racing Using Deep Imitative Reinforcement Learning	Jul 18, 2021	Autonomous DrivingAutonomous Racing	CodeCode Available	1
Megaverse: Simulating Embodied Agents at One Million Experiences per Second	Jul 17, 2021	GPUReinforcement Learning (RL)	CodeCode Available	1
Reinforcement Learning for Adaptive Optimal Stationary Control of Linear Stochastic Systems	Jul 16, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
A Reinforcement Learning Environment for Mathematical Reasoning via Program Synthesis	Jul 15, 2021	Mathematical ReasoningProgram Synthesis	CodeCode Available	1
Surgical Instruction Generation with Transformers	Jul 14, 2021	DecoderMachine Translation	CodeCode Available	1
ReLLIE: Deep Reinforcement Learning for Customized Low-Light Image Enhancement	Jul 13, 2021	Deep Reinforcement LearningImage Enhancement	CodeCode Available	1
Shortest-Path Constrained Reinforcement Learning for Sparse Reward Tasks	Jul 13, 2021	continuous-controlContinuous Control	CodeCode Available	1
Teaching Agents how to Map: Spatial Reasoning for Multi-Object Navigation	Jul 13, 2021	Reinforcement Learning (RL)Spatial Reasoning	CodeCode Available	1
Towards Better Laplacian Representation in Reinforcement Learning with Generalized Graph Drawing	Jul 12, 2021	continuous-controlContinuous Control	CodeCode Available	1
Explore and Control with Adversarial Surprise	Jul 12, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Conservative Offline Distributional Reinforcement Learning	Jul 12, 2021	D4RLDistributional Reinforcement Learning	CodeCode Available	1
Out-of-Distribution Dynamics Detection: RL-Relevant Benchmarks and Results	Jul 11, 2021	Reinforcement Learning (RL)Time Series	CodeCode Available	1
Backprop-Free Reinforcement Learning with Active Neural Generative Coding	Jul 10, 2021	Q-Learningreinforcement-learning	CodeCode Available	1
BayesSimIG: Scalable Parameter Inference for Adaptive Domain Randomization with IsaacGym	Jul 9, 2021	GPUReinforcement Learning (RL)	CodeCode Available	1
Offline Meta-Reinforcement Learning with Online Self-Supervision	Jul 8, 2021	Meta Reinforcement LearningOffline RL	CodeCode Available	1
Learning Vision-Guided Quadrupedal Locomotion End-to-End with Cross-Modal Transformers	Jul 8, 2021	Reinforcement Learning (RL)	CodeCode Available	1
Distributed Online Service Coordination Using Deep Reinforcement Learning	Jul 7, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
THE SJTU SYSTEM FOR DCASE2021 CHALLENGE TASK 6: AUDIO CAPTIONING BASED ON ENCODER PRE-TRAINING AND REINFORCEMENT LEARNING	Jul 6, 2021	Audio captioningAudio Tagging	CodeCode Available	1
Multi-Modal Mutual Information (MuMMI) Training for Robust Self-Supervised Deep Reinforcement Learning	Jul 6, 2021	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
AdaRL: What, Where, and How to Adapt in Transfer Reinforcement Learning	Jul 6, 2021	Atari Gamesreinforcement-learning	CodeCode Available	1
Agents that Listen: High-Throughput Reinforcement Learning with Multiple Sensory Systems	Jul 5, 2021	Game of Doomreinforcement-learning	CodeCode Available	1
Sample Efficient Reinforcement Learning via Model-Ensemble Exploration and Exploitation	Jul 5, 2021	continuous-controlContinuous Control	CodeCode Available	1
Mava: a research library for distributed multi-agent reinforcement learning in JAX	Jul 3, 2021	Decision MakingMulti-agent Reinforcement Learning	CodeCode Available	1
Systematic Evaluation of Causal Discovery in Visual Model Based Reinforcement Learning	Jul 2, 2021	BenchmarkingCausal Discovery	CodeCode Available	1
Reinforcement Learning for Abstractive Question Summarization with Question-aware Semantic Rewards	Jul 1, 2021	Question AnsweringQuestion Generation	CodeCode Available	1
Offline-to-Online Reinforcement Learning via Balanced Replay and Pessimistic Q-Ensemble	Jul 1, 2021	Offline RLreinforcement-learning	CodeCode Available	1
Distilling Reinforcement Learning Tricks for Video Games	Jul 1, 2021	Q-Learningreinforcement-learning	CodeCode Available	1
Stabilizing Deep Q-Learning with ConvNets and Vision Transformers under Data Augmentation	Jul 1, 2021	Data AugmentationQ-Learning	CodeCode Available	1
Experience-Driven PCG via Reinforcement Learning: A Super Mario Bros Study	Jun 30, 2021	Diversityreinforcement-learning	CodeCode Available	1
Learning Task Informed Abstractions	Jun 29, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Multi-task curriculum learning in a complex, visual, hard-exploration domain: Minecraft	Jun 28, 2021	Minecraftreinforcement-learning	CodeCode Available	1
Causal Reinforcement Learning using Observational and Interventional Data	Jun 28, 2021	Causal InferenceModel-based Reinforcement Learning	CodeCode Available	1
Graph Convolutional Memory using Topological Priors	Jun 27, 2021	Memorizationreinforcement-learning	CodeCode Available	1
Compositional Reinforcement Learning from Logical Specifications	Jun 25, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Multi-Goal Reinforcement Learning environments for simulated Franka Emika Panda robot	Jun 25, 2021	Multi-Goal Reinforcement LearningOpenAI Gym	CodeCode Available	1
Unifying Gradient Estimators for Meta-Reinforcement Learning via Off-Policy Evaluation	Jun 24, 2021	Meta Reinforcement LearningOff-policy evaluation	CodeCode Available	1
Model-Based Reinforcement Learning via Latent-Space Collocation	Jun 24, 2021	modelModel-based Reinforcement Learning	CodeCode Available	1
Reinforcement Learning-based Dialogue Guided Event Extraction to Exploit Argument Relations	Jun 23, 2021	Event ExtractionIncremental Learning	CodeCode Available	1
Local policy search with Bayesian optimization	Jun 22, 2021	Bayesian OptimizationReinforcement Learning (RL)	CodeCode Available	1
OptiDICE: Offline Policy Optimization via Stationary Distribution Correction Estimation	Jun 21, 2021	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Distributed Heuristic Multi-Agent Path Finding with Communication	Jun 21, 2021	Multi-Agent Path FindingQ-Learning	CodeCode Available	1
A Max-Min Entropy Framework for Reinforcement Learning	Jun 19, 2021	Disentanglementreinforcement-learning	CodeCode Available	1
Towards Safe Reinforcement Learning via Constraining Conditional Value at Risk	Jun 18, 2021	continuous-controlContinuous Control	CodeCode Available	1
MADE: Exploration via Maximizing Deviation from Explored Regions	Jun 18, 2021	Efficient ExplorationReinforcement Learning (RL)	CodeCode Available	1
SECANT: Self-Expert Cloning for Zero-Shot Generalization of Visual Policies	Jun 17, 2021	Autonomous DrivingImage Augmentation	CodeCode Available	1
Contrastive Reinforcement Learning of Symbolic Reasoning Domains	Jun 16, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Safe Reinforcement Learning Using Advantage-Based Intervention	Jun 16, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Revisiting the Weaknesses of Reinforcement Learning for Neural Machine Translation	Jun 16, 2021	Domain AdaptationMachine Translation	CodeCode Available	1
Solving Continuous Control with Episodic Memory	Jun 16, 2021	continuous-controlContinuous Control	CodeCode Available	1

Show:10 25 50

← PrevPage 29 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified