Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5576–5600 of 15113 papers

Title	Date	Tasks	Status	Hype
Learning to Solve Combinatorial Graph Partitioning Problems via Efficient Exploration	May 27, 2022	Efficient Explorationgraph partitioning	CodeCode Available	1
GALOIS: Boosting Deep Reinforcement Learning via Generalizable Logic Synthesis	May 27, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Distributed and Uncoordinated Cognitive Radios Resource Allocation	May 27, 2022	Deep Reinforcement LearningQ-Learning	—Unverified	0
IGLU 2022: Interactive Grounded Language Understanding in a Collaborative Environment at NeurIPS 2022	May 27, 2022	Natural Language UnderstandingReinforcement Learning (RL)	CodeCode Available	0
Double Deep Q Networks for Sensor Management in Space Situational Awareness	May 27, 2022	Managementreinforcement-learning	—Unverified	0
KL-Entropy-Regularized RL with a Generative Model is Minimax Optimal	May 27, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
FedFormer: Contextual Federation with Attention in Reinforcement Learning	May 27, 2022	Federated Learningreinforcement-learning	CodeCode Available	1
Feudal Multi-Agent Reinforcement Learning with Adaptive Network Partition for Traffic Signal Control	May 27, 2022	Graph Neural NetworkMulti-agent Reinforcement Learning	—Unverified	0
Does DQN Learn?	May 26, 2022	Q-Learningreinforcement-learning	—Unverified	0
DRLComplex: Reconstruction of protein quaternary structures using deep reinforcement learning	May 26, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Dynamic Network Reconfiguration for Entropy Maximization using Deep Reinforcement Learning	May 26, 2022	Deep Reinforcement LearningNavigate	CodeCode Available	0
Reinforcement Learning Approach for Mapping Applications to Dataflow-Based Coarse-Grained Reconfigurable Array	May 26, 2022	Graph AttentionGraph Neural Network	CodeCode Available	0
Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision Processes	May 26, 2022	Causal InferenceOffline RL	—Unverified	0
Physics-Guided Hierarchical Reward Mechanism for Learning-Based Robotic Grasping	May 26, 2022	Computational EfficiencyDeep Reinforcement Learning	—Unverified	0
SFP: State-free Priors for Exploration in Off-Policy Reinforcement Learning	May 26, 2022	continuous-controlContinuous Control	—Unverified	0
Unsupervised Reinforcement Adaptation for Class-Imbalanced Text Classification	May 26, 2022	ClassificationDomain Adaptation	CodeCode Available	0
RACE: A Reinforcement Learning Framework for Improved Adaptive Control of NoC Channel Buffers	May 26, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Embed to Control Partially Observed Systems: Representation Learning with Provable Sample Efficiency	May 26, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A Fair Federated Learning Framework With Reinforcement Learning	May 26, 2022	FairnessFederated Learning	—Unverified	0
Constrained Reinforcement Learning for Short Video Recommendation	May 26, 2022	Recommendation Systemsreinforcement-learning	—Unverified	0
Scalable Multi-Agent Model-Based Reinforcement Learning	May 25, 2022	Mambamodel	CodeCode Available	1
Stochastic Second-Order Methods Improve Best-Known Sample Complexity of SGD for Gradient-Dominated Function	May 25, 2022	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified	0
Multimodal Knowledge Alignment with Reinforcement Learning	May 25, 2022	Audio captioningLanguage Modeling	CodeCode Available	1
Near-Optimal Goal-Oriented Reinforcement Learning in Non-Stationary Environments	May 25, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
RLPrompt: Optimizing Discrete Text Prompts with Reinforcement Learning	May 25, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	2

Show:10 25 50

← PrevPage 224 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified