Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4451–4500 of 15113 papers

Title	Date	Tasks	Status	Hype
Knowing the Past to Predict the Future: Reinforcement Virtual Learning	Nov 2, 2022	Reinforcement Learning (RL)	—Unverified	0
Multi-Agent Reinforcement Learning for Adaptive Mesh Refinement	Nov 2, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Reinforcement Learning Applied to Trading Systems: A Survey	Nov 1, 2022	Articlesreinforcement-learning	—Unverified	0
Reinforcement Learning in Education: A Multi-Armed Bandit Approach	Nov 1, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Optimal Conservative Offline RL with General Function Approximation via Augmented Lagrangian	Nov 1, 2022	Decision MakingOffline RL	—Unverified	0
Online Control of Adaptive Large Neighborhood Search using Deep Reinforcement Learning	Nov 1, 2022	Bayesian OptimizationCombinatorial Optimization	CodeCode Available	1
Event Tables for Efficient Experience Replay	Nov 1, 2022	Car RacingDeep Reinforcement Learning	—Unverified	0
Can maker-taker fees prevent algorithmic cooperation in market making?	Nov 1, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Discrete Factorial Representations as an Abstraction for Goal Conditioned Reinforcement Learning	Nov 1, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Learning to Solve Voxel Building Embodied Tasks from Pixels and Natural Language Instructions	Nov 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	0
Agent-Controller Representations: Principled Offline RL with Rich Exogenous Information	Oct 31, 2022	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Disentangled (Un)Controllable Features	Oct 31, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
RLET: A Reinforcement Learning Based Approach for Explainable QA with Entailment Trees	Oct 31, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Teacher-student curriculum learning for reinforcement learning	Oct 31, 2022	Board GamesDecision Making	—Unverified	0
Agent-Time Attention for Sparse Rewards Multi-Agent Reinforcement Learning	Oct 31, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Learning to Optimize Permutation Flow Shop Scheduling via Graph-based Imitation Learning	Oct 31, 2022	Computational EfficiencyImitation Learning	—Unverified	0
DanZero: Mastering GuanDan Game with Reinforcement Learning	Oct 31, 2022	Card GamesGPU	—Unverified	0
Imitating Opponent to Win: Adversarial Policy Imitation Learning in Two-player Competitive Games	Oct 30, 2022	Deep Reinforcement LearningImitation Learning	—Unverified	0
On Rate-Distortion Theory in Capacity-Limited Cognition & Reinforcement Learning	Oct 30, 2022	Decision Makingreinforcement-learning	—Unverified	0
Planning to the Information Horizon of BAMDPs via Epistemic State Abstraction	Oct 30, 2022	Efficient Explorationreinforcement-learning	—Unverified	0
Self-Improving Safety Performance of Reinforcement Learning Based Driving with Black-Box Verification Algorithms	Oct 29, 2022	Autonomous DrivingDiversity	CodeCode Available	1
LearningGroup: A Real-Time Sparse Training on FPGA via Learnable Weight Grouping for Multi-Agent Reinforcement Learning	Oct 29, 2022	GPUMulti-agent Reinforcement Learning	—Unverified	0
BIMRL: Brain Inspired Meta Reinforcement Learning	Oct 29, 2022	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1
DeFIX: Detecting and Fixing Failure Scenarios with Reinforcement Learning in Imitation Learning Based Autonomous Driving	Oct 29, 2022	Autonomous DrivingCARLA MAP Leaderboard	CodeCode Available	1
Reinforcement Learning-based Defect Mitigation for Quality Assurance of Additive Manufacturing	Oct 28, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Using Contrastive Samples for Identifying and Leveraging Possible Causal Relationships in Reinforcement Learning	Oct 28, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Nonuniqueness and Convergence to Equivalent Solutions in Observer-based Inverse Reinforcement Learning	Oct 28, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Goal Exploration Augmentation via Pre-trained Skills for Sparse-Reward Long-Horizon Goal-Conditioned Reinforcement Learning	Oct 28, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
Hybrid Indoor Localization via Reinforcement Learning-based Information Fusion	Oct 27, 2022	Decision MakingIndoor Localization	—Unverified	0
Language Control Diffusion: Efficiently Scaling through Space, Time, and Tasks	Oct 27, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Many-Objective Reinforcement Learning for Online Testing of DNN-Enabled Systems	Oct 27, 2022	Autonomous Drivingreinforcement-learning	—Unverified	0
SAM-RL: Sensing-Aware Model-Based Reinforcement Learning via Differentiable Physics-Based Simulation and Rendering	Oct 27, 2022	Deformable Object ManipulationModel-based Reinforcement Learning	—Unverified	0
Meta-Reinforcement Learning Using Model Parameters	Oct 27, 2022	Meta Reinforcement Learningmodel	—Unverified	0
Towards customizable reinforcement learning agents: Enabling preference specification through online vocabulary expansion	Oct 27, 2022	Data AugmentationMinecraft	—Unverified	0
ERL-Re^2: Efficient Evolutionary Reinforcement Learning with Shared State Representation and Individual Policy Representation	Oct 26, 2022	continuous-controlContinuous Control	CodeCode Available	1
Knowledge-Guided Exploration in Deep Reinforcement Learning	Oct 26, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Environment Design for Inverse Reinforcement Learning	Oct 26, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
Low-Rank Modular Reinforcement Learning via Muscle Synergy	Oct 26, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Quantum deep recurrent reinforcement learning	Oct 26, 2022	Decision MakingQ-Learning	—Unverified	0
Provable Safe Reinforcement Learning with Binary Feedback	Oct 26, 2022	Active Learningreinforcement-learning	CodeCode Available	1
Uncertainty-based Meta-Reinforcement Learning for Robust Radar Tracking	Oct 26, 2022	Meta-LearningMeta Reinforcement Learning	—Unverified	0
D-Shape: Demonstration-Shaped Reinforcement Learning via Goal Conditioning	Oct 26, 2022	Imitation Learningreinforcement-learning	—Unverified	0
A Bibliometric Analysis and Review on Reinforcement Learning for Transportation Applications	Oct 26, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to Reality	Oct 25, 2022	Deep Reinforcement LearningGPU	CodeCode Available	4
Bridging Distributional and Risk-sensitive Reinforcement Learning with Provable Regret Bounds	Oct 25, 2022	Computational EfficiencyDistributional Reinforcement Learning	—Unverified	0
Adaptive Behavior Cloning Regularization for Stable Offline-to-Online Reinforcement Learning	Oct 25, 2022	D4RLOffline RL	CodeCode Available	1
Entity Divider with Language Grounding in Multi-Agent Reinforcement Learning	Oct 25, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Sim-to-Real via Sim-to-Seg: End-to-end Off-road Autonomous Driving Without Real Data	Oct 25, 2022	Autonomous DrivingGPU	CodeCode Available	1
Teal: Learning-Accelerated Optimization of WAN Traffic Engineering	Oct 25, 2022	Graph Neural NetworkMulti-agent Reinforcement Learning	CodeCode Available	1
Shortest Edit Path Crossover: A Theory-driven Solution to the Permutation Problem in Evolutionary Neural Architecture Search	Oct 25, 2022	Evolutionary AlgorithmsNeural Architecture Search	CodeCode Available	0

Show:10 25 50

← PrevPage 90 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified