Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8701–8750 of 15113 papers

Title	Date	Tasks	Status
Reinforced Hybrid Genetic Algorithm for the Traveling Salesman Problem	Jul 9, 2021	DiversityQ-Learning	—Unverified
Offline reinforcement learning with uncertainty for treatment strategies in sepsis	Jul 9, 2021	reinforcement-learningReinforcement Learning	—Unverified
Inferring Probabilistic Reward Machines from Non-Markovian Reward Processes for Reinforcement Learning	Jul 9, 2021	Decision Makingreinforcement-learning	—Unverified
Attend2Pack: Bin Packing through Deep Reinforcement Learning with Attention	Jul 9, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning Interaction-aware Guidance Policies for Motion Planning in Dense Traffic Scenarios	Jul 9, 2021	Autonomous NavigationAutonomous Vehicles	—Unverified
Aligning an optical interferometer with beam divergence control and continuous action space	Jul 9, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Policy Gradient Methods for Distortion Risk Measures	Jul 9, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
CLAIM: Curriculum Learning Policy for Influence Maximization in Unknown Social Networks	Jul 8, 2021	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Stress Testing for Adversarial Learning in a Financial Environment	Jul 8, 2021	Fraud Detectionregression	—Unverified
Automated Gain Control Through Deep Reinforcement Learning for Downstream Radar Object Detection	Jul 8, 2021	Active LearningDeep Reinforcement Learning	—Unverified
Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning	Jul 8, 2021	Gaussian ProcessesModel-based Reinforcement Learning	—Unverified
Enhancing Video Analytics Accuracy via Real-time Automated Camera Parameter Tuning	Jul 8, 2021	Face DetectionFace Recognition	—Unverified
Adaptation of Quadruped Robot Locomotion with Meta-Learning	Jul 8, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified
Computational Benefits of Intermediate Rewards for Goal-Reaching Policy Learning	Jul 8, 2021	Hierarchical Reinforcement LearningQ-Learning	CodeCode Available
Sublinear Regret for Learning POMDPs	Jul 8, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Towards Autonomous Pipeline Inspection with Hierarchical Reinforcement Learning	Jul 8, 2021	Autonomous NavigationDeep Reinforcement Learning	—Unverified
Quadruped Locomotion on Non-Rigid Terrain using Reinforcement Learning	Jul 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Pseudo-Model-Free Hedging for Variable Annuities via Deep Reinforcement Learning	Jul 7, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Federated Model Search via Reinforcement Learning	Jul 7, 2021	Federated LearningImage Classification	—Unverified
Learning Time-Invariant Reward Functions through Model-Based Inverse Reinforcement Learning	Jul 7, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
DORA: Toward Policy Optimization for Task-oriented Dialogue System with Efficient Context	Jul 7, 2021	Reinforcement Learning (RL)Task-Oriented Dialogue Systems	CodeCode Available
A Unified Off-Policy Evaluation Approach for General Value Function	Jul 6, 2021	Anomaly DetectionOff-policy evaluation	—Unverified
A Short Note on the Relationship of Information Gain and Eluder Dimension	Jul 6, 2021	LEMMAreinforcement-learning	—Unverified
Meta-Reinforcement Learning for Heuristic Planning	Jul 6, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified
The Least Restriction for Offline Reinforcement Learning	Jul 5, 2021	Offline RLQ-Learning	—Unverified
Winning at Any Cost -- Infringing the Cartel Prohibition With Reinforcement Learning	Jul 5, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Gradient Importance Learning for Incomplete Observations	Jul 5, 2021	ImputationMissing Values	CodeCode Available
A Review of Explainable Artificial Intelligence in Manufacturing	Jul 5, 2021	Decision MakingExplainable artificial intelligence	—Unverified
Ensemble and Auxiliary Tasks for Data-Efficient Deep Reinforcement Learning	Jul 5, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available
Control of rough terrain vehicles using deep reinforcement learning	Jul 5, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Low Dimensional State Representation Learning with Robotics Priors in Continuous Action Spaces	Jul 4, 2021	reinforcement-learningReinforcement Learning	—Unverified
Low-Dimensional State and Action Representation Learning with MDP Homomorphism Metrics	Jul 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Restless and Uncertain: Robust Policies for Restless Bandits via Deep Multi-Agent Reinforcement Learning	Jul 4, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Traffic Signal Control with Communicative Deep Reinforcement Learning Agents: a Case Study	Jul 3, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Optimality Inductive Biases and Agnostic Guidelines for Offline Reinforcement Learning	Jul 3, 2021	AttributeInductive Bias	CodeCode Available
Examining average and discounted reward optimality criteria in reinforcement learning	Jul 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
Controlled Interacting Particle Algorithms for Simulation-based Reinforcement Learning	Jul 2, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
A Novel Deep Reinforcement Learning Based Stock Direction Prediction using Knowledge Graph and Community Aware Sentiments	Jul 2, 2021	Deep Reinforcement LearningPrediction	—Unverified
Beyond Value-Function Gaps: Improved Instance-Dependent Regret Bounds for Episodic Reinforcement Learning	Jul 2, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning for Feedback-Enabled Cyber Resilience	Jul 2, 2021	Intrusion Detectionreinforcement-learning	—Unverified
RL-NCS: Reinforcement learning based data-driven approach for nonuniform compressed sensing	Jul 2, 2021	compressed sensingreinforcement-learning	CodeCode Available
SocialAI: Benchmarking Socio-Cognitive Abilities in Deep Reinforcement Learning Agents	Jul 2, 2021	BenchmarkingDeep Reinforcement Learning	—Unverified
Optimal Power Allocation for Rate Splitting Communications with Deep Reinforcement Learning	Jul 1, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
MHER: Model-based Hindsight Experience Replay	Jul 1, 2021	modelMulti-Goal Reinforcement Learning	—Unverified
Model Mediated Teleoperation with a Hand-Arm Exoskeleton in Long Time Delays Using Reinforcement Learning	Jul 1, 2021	Reinforcement Learning (RL)	—Unverified
Blending Task Success and User Satisfaction: Analysis of Learned Dialogue Behaviour with Multiple Rewards	Jul 1, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Goal-Conditioned Reinforcement Learning with Imagined Subgoals	Jul 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Inverse Reinforcement Learning Based Stochastic Driver Behavior Learning	Jul 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Decomposing the Prediction Problem; Autonomous Navigation by neoRL Agents	Jun 30, 2021	Autonomous NavigationPrediction	—Unverified
Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in Edge Industrial IoT	Jun 30, 2021	Decision MakingEdge-computing	—Unverified

Show:10 25 50

← PrevPage 175 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified