Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6151–6200 of 15113 papers

Title	Date	Tasks	Status	Hype
Multi-fidelity reinforcement learning framework for shape optimization	Feb 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reward-Free Policy Space Compression for Reinforcement Learning	Feb 22, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
A Comparative Study of Deep Reinforcement Learning-based Transferable Energy Management Strategies for Hybrid Electric Vehicles	Feb 22, 2022	Deep Reinforcement Learningenergy management	CodeCode Available	1
Continual Auxiliary Task Learning	Feb 22, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Behaviour-neutral Smart Charging of Plugin Electric Vehicles: Reinforcement learning approach	Feb 22, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A policy gradient approach for optimization of smooth risk measures	Feb 22, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Behaviour-Diverse Automatic Penetration Testing: A Curiosity-Driven Multi-Objective Deep Reinforcement Learning Approach	Feb 22, 2022	Deep Reinforcement LearningMulti-Objective Reinforcement Learning	—Unverified	0
A Decentralized Communication Framework based on Dual-Level Recurrence for Multi-Agent Reinforcement Learning	Feb 22, 2022	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Sequential Information Design: Markov Persuasion Process and Its Efficient Reinforcement Learning	Feb 22, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning Framework for Server Placement and Workload Allocation in Multi-Access Edge Computing	Feb 21, 2022	Cloud ComputingCombinatorial Optimization	—Unverified	0
Hybrid Learning for Orchestrating Deep Learning Inference in Multi-user Edge-cloud Networks	Feb 21, 2022	Cloud ComputingDeep Learning	—Unverified	0
Autonomous Warehouse Robot using Deep Q-Learning	Feb 21, 2022	Deep Reinforcement LearningNavigate	—Unverified	0
A Multi-Agent Reinforcement Learning Framework for Off-Policy Evaluation in Two-sided Markets	Feb 21, 2022	ManagementMulti-agent Reinforcement Learning	CodeCode Available	0
Don't Touch What Matters: Task-Aware Lipschitz Data Augmentation for Visual Reinforcement Learning	Feb 21, 2022	Data AugmentationDiversity	CodeCode Available	1
Accelerating Primal-dual Methods for Regularized Markov Decision Processes	Feb 21, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
CCPT: Automatic Gameplay Testing and Validation with Curiosity-Conditioned Proximal Trajectories	Feb 21, 2022	Deep Reinforcement LearningGame Design	—Unverified	0
Learning Causal Overhypotheses through Exploration in Children and Computational Models	Feb 21, 2022	Causal InferenceEfficient Exploration	—Unverified	0
Rule Mining over Knowledge Graphs via Reinforcement Learning	Feb 21, 2022	Knowledge Graphsreinforcement-learning	—Unverified	0
Selective Credit Assignment	Feb 20, 2022	Predictionreinforcement-learning	—Unverified	0
PooL: Pheromone-inspired Communication Framework forLarge Scale Multi-Agent Reinforcement Learning	Feb 20, 2022	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
Who Are the Best Adopters? User Selection Model for Free Trial Item Promotion	Feb 19, 2022	Marketingreinforcement-learning	—Unverified	0
Multi-task Safe Reinforcement Learning for Navigating Intersections in Dense Traffic	Feb 19, 2022	Autonomous Drivingreinforcement-learning	—Unverified	0
Robust Reinforcement Learning as a Stackelberg Game via Adaptively-Regularized Adversarial Training	Feb 19, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Shaping Advice in Deep Reinforcement Learning	Feb 19, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	0
Transformation Coding: Simple Objectives for Equivariant Representations	Feb 19, 2022	Disentanglementreinforcement-learning	—Unverified	0
TransDreamer: Reinforcement Learning with Transformer World Models	Feb 19, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
A Behavior Regularized Implicit Policy for Offline Reinforcement Learning	Feb 19, 2022	D4RLreinforcement-learning	—Unverified	0
Can Interpretable Reinforcement Learning Manage Prosperity Your Way?	Feb 18, 2022	Asset ManagementDecision Making	—Unverified	0
Distributed Multi-Agent Reinforcement Learning with One-hop Neighbors and Compute Straggler Mitigation	Feb 18, 2022	Distributed ComputingMulti-agent Reinforcement Learning	CodeCode Available	1
tinyMAN: Lightweight Energy Manager using Reinforcement Learning for Energy Harvesting Wearable IoT Devices	Feb 18, 2022	energy managementManagement	—Unverified	0
UAV Base Station Trajectory Optimization Based on Reinforcement Learning in Post-disaster Search and Rescue Operations	Feb 17, 2022	ClusteringQ-Learning	—Unverified	0
VRL3: A Data-Driven Framework for Visual Deep Reinforcement Learning	Feb 17, 2022	Deep Reinforcement LearningOffline RL	CodeCode Available	2
Efficient Learning of Safe Driving Policy via Human-AI Copilot Optimization	Feb 17, 2022	Imitation Learningreinforcement-learning	—Unverified	0
CADRE: A Cascade Deep Reinforcement Learning Framework for Vision-based Autonomous Urban Driving	Feb 17, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
A Survey on Deep Reinforcement Learning-based Approaches for Adaptation and Generalization	Feb 17, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Improving Intrinsic Exploration with Language Abstractions	Feb 17, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
BADDr: Bayes-Adaptive Deep Dropout RL for POMDPs	Feb 17, 2022	Reinforcement Learning (RL)State Estimation	—Unverified	0
A Survey of Explainable Reinforcement Learning	Feb 17, 2022	Decision Makingreinforcement-learning	—Unverified	0
Retrieval-Augmented Reinforcement Learning	Feb 17, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Should I send this notification? Optimizing push notifications decision making by modeling the future	Feb 17, 2022	Decision MakingModel-based Reinforcement Learning	—Unverified	0
Robust Reinforcement Learning via Genetic Curriculum	Feb 17, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Soft Actor-Critic Deep Reinforcement Learning for Fault Tolerant Flight Control	Feb 16, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Open-Ended Reinforcement Learning with Neural Reward Functions	Feb 16, 2022	Montezuma's Revengereinforcement-learning	CodeCode Available	1
Policy Learning and Evaluation with Randomized Quasi-Monte Carlo	Feb 16, 2022	continuous-controlContinuous Control	—Unverified	0
Branching Reinforcement Learning	Feb 16, 2022	LEMMARecommendation Systems	—Unverified	0
Domain Adaptive Fake News Detection via Reinforcement Learning	Feb 16, 2022	Fake News Detectionreinforcement-learning	—Unverified	0
An Intrusion Response System utilizing Deep Q-Networks and System Partitions	Feb 16, 2022	Reinforcement Learning (RL)Transfer Learning	CodeCode Available	0
Deep Reinforcement Learning Based Multi-Access Edge Computing Schedule for Internet of Vehicle	Feb 15, 2022	Deep Reinforcement LearningEdge-computing	—Unverified	0
Energy-Efficient Parking Analytics System using Deep Reinforcement Learning	Feb 15, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Safe Reinforcement Learning by Imagining the Near Future	Feb 15, 2022	continuous-controlContinuous Control	CodeCode Available	1

Show:10 25 50

← PrevPage 124 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified