Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14701–14750 of 15113 papers

Title	Date	Tasks	Status
Cross-View Policy Learning for Street Navigation	Jun 13, 2019	Deep Reinforcement LearningNavigate	CodeCode Available
Learning State Representations from Random Deep Action-conditional Predictions	Feb 9, 2021	Atari GamesReinforcement Learning (RL)	CodeCode Available
GLIB: Efficient Exploration for Relational Model-Based Reinforcement Learning via Goal-Literal Babbling	Jan 22, 2020	Decision MakingEfficient Exploration	CodeCode Available
A0C: Alpha Zero in Continuous Action Space	May 24, 2018	Board Gamesreinforcement-learning	CodeCode Available
Learning State Representations via Retracing in Reinforcement Learning	Nov 24, 2021	continuous-controlContinuous Control	CodeCode Available
Energy-Efficient Parking Analytics System using Deep Reinforcement Learning	Feb 15, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Energy-Efficient Thermal Comfort Control in Smart Buildings via Deep Reinforcement Learning	Jan 15, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Global and Local Analysis of Interestingness for Competency-Aware Deep Reinforcement Learning	Nov 11, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Cross-Trajectory Representation Learning for Zero-Shot Generalization in RL	Jun 4, 2021	Reinforcement Learning (RL)Representation Learning	CodeCode Available
Crossmodal Attentive Skill Learner	Nov 28, 2017	Atari GamesCPU	CodeCode Available
A Scavenger Hunt for Service Robots	Mar 9, 2021	Reinforcement Learning (RL)	CodeCode Available
Artificial Intelligence for Prosthetics - challenge solutions	Feb 7, 2019	Deep Reinforcement LearningImitation Learning	CodeCode Available
Cross-domain Random Pre-training with Prototypes for Reinforcement Learning	Feb 11, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Globally Optimal Hierarchical Reinforcement Learning for Linearly-Solvable Markov Decision Processes	Jun 29, 2021	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available
Learning Dynamic Context Augmentation for Global Entity Linking	Sep 4, 2019	Entity DisambiguationEntity Linking	CodeCode Available
Blockwise Sequential Model Learning for Partially Observable Reinforcement Learning	Dec 10, 2021	Partially Observable Reinforcement Learningreinforcement-learning	CodeCode Available
Blind Inpainting of Large-scale Masks of Thin Structures with Adversarial and Reinforcement Learning	Dec 5, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
CROP: Towards Distributional-Shift Robust Reinforcement Learning using Compact Reshaped Observation Processing	Apr 26, 2023	Data AugmentationDiversity	CodeCode Available
Blackout Mitigation via Physics-guided RL	Jan 17, 2024	Reinforcement Learning (RL)	CodeCode Available
Enforcing Almost-Sure Reachability in POMDPs	Jun 30, 2020	Decision Makingreinforcement-learning	CodeCode Available
Black-Box Data-efficient Policy Search for Robotics	Mar 21, 2017	Continuous ControlReinforcement Learning	CodeCode Available
Bipedal Walking Robot using Deep Deterministic Policy Gradient	Jul 16, 2018	BIG-bench Machine LearningDecision Making	CodeCode Available
Biologically Plausible Variational Policy Gradient with Spiking Recurrent Winner-Take-All Networks	Oct 21, 2022	AllReinforcement Learning (RL)	CodeCode Available
CROP: Certifying Robust Policies for Reinforcement Learning through Functional Smoothing	Jun 17, 2021	Atari GamesAutonomous Vehicles	CodeCode Available
Is Deep Reinforcement Learning Really Superhuman on Atari? Leveling the playing field	Aug 13, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
A Comparison of Reinforcement Learning Frameworks for Software Testing Tasks	Aug 25, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
BindsNET: A machine learning-oriented spiking neural networks library in Python	Jun 4, 2018	BIG-bench Machine LearningCPU	CodeCode Available
Goal-conditioned Imitation Learning	Jun 13, 2019	Imitation LearningReinforcement Learning	CodeCode Available
Navigation Agents for the Visually Impaired: A Sidewalk Simulator and Experiments	Oct 29, 2019	NavigateReinforcement Learning	CodeCode Available
Improving Generalization on the ProcGen Benchmark with Simple Architectural Changes and Scale	Oct 13, 2024	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Goal-Conditioned Q-Learning as Knowledge Distillation	Aug 28, 2022	Knowledge DistillationQ-Learning	CodeCode Available
BiERL: A Meta Evolutionary Reinforcement Learning Framework via Bilevel Optimization	Aug 1, 2023	Bilevel OptimizationDiversity	CodeCode Available
Self-Attentional Credit Assignment for Transfer in Reinforcement Learning	Jul 18, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Is Feedback All You Need? Leveraging Natural Language Feedback in Goal-Conditioned Reinforcement Learning	Dec 7, 2023	AllReinforcement Learning (RL)	CodeCode Available
Learning Structural Weight Uncertainty for Sequential Decision-Making	Dec 30, 2017	Decision MakingMulti-Armed Bandits	CodeCode Available
CRC-RL: A Novel Visual Feature Representation Architecture for Unsupervised Reinforcement Learning	Jan 31, 2023	Decoderreinforcement-learning	CodeCode Available
An Empirical Evaluation of Posterior Sampling for Constrained Reinforcement Learning	Sep 8, 2022	Efficient Explorationreinforcement-learning	CodeCode Available
Crawling in Rogue's dungeons with (partitioned) A3C	Apr 23, 2018	reinforcement-learningReinforcement Learning	CodeCode Available
Improving Image Captioning with Conditional Generative Adversarial Nets	May 18, 2018	DecoderImage Captioning	CodeCode Available
Improving Information Extraction by Acquiring External Evidence with Reinforcement Learning	Mar 25, 2016	reinforcement-learningReinforcement Learning	CodeCode Available
5G Routing Interfered Environment	Mar 28, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Enhancing Commentary Strategies for Imperfect Information Card Games: A Study of Large Language Models in Guandan Commentary	Jun 23, 2024	Card GamesReinforcement Learning (RL)	CodeCode Available
Goal Exploration Augmentation via Pre-trained Skills for Sparse-Reward Long-Horizon Goal-Conditioned Reinforcement Learning	Oct 28, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Crafting desirable climate trajectories with RL explored socio-environmental simulations	Oct 9, 2024	Decision MakingDecision Making Under Uncertainty	CodeCode Available
BF++: a language for general-purpose program synthesis	Jan 23, 2021	Decision MakingOpenAI Gym	CodeCode Available
Crafting a Toolchain for Image Restoration by Deep Reinforcement Learning	Apr 10, 2018	Deep Reinforcement LearningImage Restoration	CodeCode Available
Crafting a Pogo Stick in Minecraft with Heuristic Search (Extended Abstract)	Jun 1, 2024	Heuristic SearchMinecraft	CodeCode Available
Course Recommender Systems Need to Consider the Job Market	Apr 16, 2024	Recommendation SystemsReinforcement Learning (RL)	CodeCode Available
Countering Reward Over-optimization in LLM with Demonstration-Guided Reinforcement Learning	Apr 30, 2024	Reinforcement Learning (RL)Text Generation	CodeCode Available
Adaptive Power System Emergency Control using Deep Reinforcement Learning	Mar 9, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 295 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified