Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5901–5950 of 15113 papers

Title	Date	Tasks	Status
Dual Generator Offline Reinforcement Learning	Nov 2, 2022	Offline RLreinforcement-learning	—Unverified
Deep Reinforcement Learning for Power Control in Next-Generation WiFi Network Systems	Nov 2, 2022	Deep Reinforcement LearningQ-Learning	—Unverified
Behavior Prior Representation learning for Offline Reinforcement Learning	Nov 2, 2022	Offline RLreinforcement-learning	CodeCode Available
DynamicLight: Two-Stage Dynamic Traffic Signal Timing	Nov 2, 2022	Q-LearningReinforcement Learning (RL)	CodeCode Available
Knowing the Past to Predict the Future: Reinforcement Virtual Learning	Nov 2, 2022	Reinforcement Learning (RL)	—Unverified
Offline RL With Realistic Datasets: Heteroskedasticity and Support Constraints	Nov 2, 2022	Atari GamesOffline RL	—Unverified
Over-communicate no more: Situated RL agents learn concise communication protocols	Nov 2, 2022	Reinforcement Learning (RL)	—Unverified
Wind Power Forecasting Considering Data Privacy Protection: A Federated Deep Reinforcement Learning Approach	Nov 2, 2022	Deep Reinforcement LearningFederated Learning	—Unverified
Model-based Reinforcement Learning with a Hamiltonian Canonical ODE Network	Nov 2, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Optimal Conservative Offline RL with General Function Approximation via Augmented Lagrangian	Nov 1, 2022	Decision MakingOffline RL	—Unverified
Reinforcement Learning in Education: A Multi-Armed Bandit Approach	Nov 1, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Applied to Trading Systems: A Survey	Nov 1, 2022	Articlesreinforcement-learning	—Unverified
Can maker-taker fees prevent algorithmic cooperation in market making?	Nov 1, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Learning to Solve Voxel Building Embodied Tasks from Pixels and Natural Language Instructions	Nov 1, 2022	Language ModelingLanguage Modelling	CodeCode Available
Event Tables for Efficient Experience Replay	Nov 1, 2022	Car RacingDeep Reinforcement Learning	—Unverified
Discrete Factorial Representations as an Abstraction for Goal Conditioned Reinforcement Learning	Nov 1, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
DanZero: Mastering GuanDan Game with Reinforcement Learning	Oct 31, 2022	Card GamesGPU	—Unverified
Learning to Optimize Permutation Flow Shop Scheduling via Graph-based Imitation Learning	Oct 31, 2022	Computational EfficiencyImitation Learning	—Unverified
Disentangled (Un)Controllable Features	Oct 31, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Agent-Time Attention for Sparse Rewards Multi-Agent Reinforcement Learning	Oct 31, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Teacher-student curriculum learning for reinforcement learning	Oct 31, 2022	Board GamesDecision Making	—Unverified
On Rate-Distortion Theory in Capacity-Limited Cognition & Reinforcement Learning	Oct 30, 2022	Decision Makingreinforcement-learning	—Unverified
Planning to the Information Horizon of BAMDPs via Epistemic State Abstraction	Oct 30, 2022	Efficient Explorationreinforcement-learning	—Unverified
Imitating Opponent to Win: Adversarial Policy Imitation Learning in Two-player Competitive Games	Oct 30, 2022	Deep Reinforcement LearningImitation Learning	—Unverified
LearningGroup: A Real-Time Sparse Training on FPGA via Learnable Weight Grouping for Multi-Agent Reinforcement Learning	Oct 29, 2022	GPUMulti-agent Reinforcement Learning	—Unverified
Goal Exploration Augmentation via Pre-trained Skills for Sparse-Reward Long-Horizon Goal-Conditioned Reinforcement Learning	Oct 28, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning-based Defect Mitigation for Quality Assurance of Additive Manufacturing	Oct 28, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Nonuniqueness and Convergence to Equivalent Solutions in Observer-based Inverse Reinforcement Learning	Oct 28, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Using Contrastive Samples for Identifying and Leveraging Possible Causal Relationships in Reinforcement Learning	Oct 28, 2022	reinforcement-learningReinforcement Learning	—Unverified
SAM-RL: Sensing-Aware Model-Based Reinforcement Learning via Differentiable Physics-Based Simulation and Rendering	Oct 27, 2022	Deformable Object ManipulationModel-based Reinforcement Learning	—Unverified
Towards customizable reinforcement learning agents: Enabling preference specification through online vocabulary expansion	Oct 27, 2022	Data AugmentationMinecraft	—Unverified
Many-Objective Reinforcement Learning for Online Testing of DNN-Enabled Systems	Oct 27, 2022	Autonomous Drivingreinforcement-learning	—Unverified
Meta-Reinforcement Learning Using Model Parameters	Oct 27, 2022	Meta Reinforcement Learningmodel	—Unverified
Hybrid Indoor Localization via Reinforcement Learning-based Information Fusion	Oct 27, 2022	Decision MakingIndoor Localization	—Unverified
A Bibliometric Analysis and Review on Reinforcement Learning for Transportation Applications	Oct 26, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
D-Shape: Demonstration-Shaped Reinforcement Learning via Goal Conditioning	Oct 26, 2022	Imitation Learningreinforcement-learning	—Unverified
Knowledge-Guided Exploration in Deep Reinforcement Learning	Oct 26, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Environment Design for Inverse Reinforcement Learning	Oct 26, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Uncertainty-based Meta-Reinforcement Learning for Robust Radar Tracking	Oct 26, 2022	Meta-LearningMeta Reinforcement Learning	—Unverified
Quantum deep recurrent reinforcement learning	Oct 26, 2022	Decision MakingQ-Learning	—Unverified
Shortest Edit Path Crossover: A Theory-driven Solution to the Permutation Problem in Evolutionary Neural Architecture Search	Oct 25, 2022	Evolutionary AlgorithmsNeural Architecture Search	CodeCode Available
One-shot, Offline and Production-Scalable PID Optimisation with Deep Reinforcement Learning	Oct 25, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Bridging Distributional and Risk-sensitive Reinforcement Learning with Provable Regret Bounds	Oct 25, 2022	Computational EfficiencyDistributional Reinforcement Learning	—Unverified
Entity Divider with Language Grounding in Multi-Agent Reinforcement Learning	Oct 25, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
AACHER: Assorted Actor-Critic Deep Reinforcement Learning with Hindsight Experience Replay	Oct 24, 2022	Deep Reinforcement LearningFetchPush-v1	CodeCode Available
Graph Reinforcement Learning-based CNN Inference Offloading in Dynamic Edge Computing	Oct 24, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Classifying Ambiguous Identities in Hidden-Role Stochastic Games with Multi-Agent Reinforcement Learning	Oct 24, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Dichotomy of Control: Separating What You Can Control from What You Cannot	Oct 24, 2022	Reinforcement Learning (RL)	—Unverified
Causal Explanation for Reinforcement Learning: Quantifying State and Temporal Importance	Oct 24, 2022	Collision Avoidancereinforcement-learning	—Unverified
Hardness in Markov Decision Processes: Theory and Practice	Oct 24, 2022	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 119 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified