Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1551–1560 of 15113 papers

Title	Date	Tasks	Status	Hype
An Equivalence between Loss Functions and Non-Uniform Sampling in Experience Replay	Jul 12, 2020	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
Learning to swim in potential flow	Sep 30, 2020	Motion Planningreinforcement-learning	CodeCode Available	1
Combinatorial Optimization by Graph Pointer Networks and Hierarchical Reinforcement Learning	Nov 12, 2019	Combinatorial OptimizationGraph Embedding	CodeCode Available	1
Learning to Walk by Steering: Perceptive Quadrupedal Locomotion in Dynamic Environments	Sep 19, 2022	Decision MakingImitation Learning	CodeCode Available	1
Agent-Temporal Attention for Reward Redistribution in Episodic Multi-Agent Reinforcement Learning	Jan 12, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Learning Trajectories for Visual-Inertial System Calibration via Model-based Heuristic Deep Reinforcement Learning	Nov 4, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Making Offline RL Online: Collaborative World Models for Offline Visual Reinforcement Learning	May 24, 2023	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Learning When and Where to Zoom with Deep Reinforcement Learning	Mar 1, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
LEDRO: LLM-Enhanced Design Space Reduction and Optimization for Analog Circuits	Nov 19, 2024	Bayesian OptimizationReinforcement Learning (RL)	CodeCode Available	1
Abstract-to-Executable Trajectory Translation for One-Shot Task Generalization	Oct 14, 2022	Few-Shot Imitation LearningReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 156 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified