Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8151–8200 of 15113 papers

Title	Date	Tasks	Status
You Only Evaluate Once: a Simple Baseline Algorithm for Offline RL	Oct 5, 2021	D4RLOffline RL	—Unverified
NaRLE: Natural Language Models using Reinforcement Learning with Emotion Feedback	Oct 5, 2021	Deep Reinforcement Learningintent-classification	—Unverified
Mining for Potent Inhibitors through Artificial Intelligence and Physics: A Unified Methodology for Ligand Based and Structure Based Drug Design	Oct 5, 2021	Deep Reinforcement LearningDrug Design	—Unverified
Reinforcement Learning for Admission Control in Wireless Virtual Network Embedding	Oct 4, 2021	Deep Reinforcement LearningNetwork Embedding	—Unverified
Multi-Agent Path Planning Using Deep Reinforcement Learning	Oct 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning to Assist Agents by Observing Them	Oct 4, 2021	AI Agentreinforcement-learning	—Unverified
Automating Privilege Escalation with Deep Reinforcement Learning	Oct 4, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
A Modified Q-Learning Algorithm for Rate-Profiling of Polarization Adjusted Convolutional (PAC) Codes	Oct 4, 2021	Q-Learningreinforcement-learning	—Unverified
Hit and Lead Discovery with Explorative RL and Fragment-based Molecule Generation	Oct 4, 2021	Drug DesignMolecular Docking	—Unverified
Behaviour-conditioned policies for cooperative reinforcement learning tasks	Oct 4, 2021	Deep Reinforcement LearningMeta-Learning	—Unverified
Decentralized Safe Reinforcement Learning for Voltage Control	Oct 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
A Novel Automated Curriculum Strategy to Solve Hard Sokoban Planning Instances	Oct 3, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
DRL-Clusters: Buffer Management with Clustering based Deep Reinforcement Learning	Oct 3, 2021	ClusteringDeep Reinforcement Learning	—Unverified
Parallel Actors and Learners: A Framework for Generating Scalable RL Implementations	Oct 3, 2021	CPUGPU	—Unverified
Meta-Reinforcement Learning via Buffering Graph Signatures for Live Video Streaming Events	Oct 3, 2021	Meta-LearningMeta Reinforcement Learning	CodeCode Available
Mapping Language to Programs using Multiple Reward Components with Inverse Reinforcement Learning	Oct 2, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Seeking Visual Discomfort: Curiosity-driven Representations for Reinforcement Learning	Oct 2, 2021	Diversityreinforcement-learning	—Unverified
Feel-Good Thompson Sampling for Contextual Bandits and Reinforcement Learning	Oct 2, 2021	Multi-Armed Banditsregression	—Unverified
BRAC+: Improved Behavior Regularized Actor Critic for Offline Reinforcement Learning	Oct 2, 2021	Offline RLreinforcement-learning	CodeCode Available
DNN-Opt: An RL Inspired Optimization for Analog Circuit Sizing using Deep Neural Networks	Oct 1, 2021	Reinforcement Learning (RL)	—Unverified
Guiding Evolutionary Strategies by Differentiable Robot Simulators	Oct 1, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
A Cramér Distance perspective on Quantile Regression based Distributional Reinforcement Learning	Oct 1, 2021	Distributional Reinforcement Learningquantile regression	CodeCode Available
Cellular traffic offloading via Opportunistic Networking with Reinforcement Learning	Oct 1, 2021	Q-Learningreinforcement-learning	—Unverified
Divergence-Regularized Multi-Agent Actor-Critic	Oct 1, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Terminal Adaptive Guidance for Autonomous Hypersonic Strike Weapons via Reinforcement Learning	Oct 1, 2021	Meta-Learningreinforcement-learning	—Unverified
Safety aware model-based reinforcement learning for optimal control of a class of output-feedback nonlinear systems	Oct 1, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Motion Planning for Autonomous Vehicles in the Presence of Uncertainty Using Reinforcement Learning	Oct 1, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified
Multi-lane Cruising Using Hierarchical Planning and Reinforcement Learning	Oct 1, 2021	Hierarchical Reinforcement LearningMotion Planning	—Unverified
Is Policy Learning Overrated?: Width-Based Planning and Active Learning for Atari	Sep 30, 2021	Active LearningAtari Games	CodeCode Available
Stability Constrained Reinforcement Learning for Real-Time Voltage Control	Sep 30, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Neural Network Verification in Control	Sep 30, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Surveillance Evasion Through Bayesian Reinforcement Learning	Sep 30, 2021	regressionreinforcement-learning	CodeCode Available
Modeling Interactions of Autonomous Vehicles and Pedestrians with Deep Multi-Agent Reinforcement Learning for Collision Avoidance	Sep 30, 2021	Autonomous VehiclesCollision Avoidance	—Unverified
Trajectory Planning with Deep Reinforcement Learning in High-Level Action Spaces	Sep 30, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Solving the Real Robot Challenge using Deep Reinforcement Learning	Sep 30, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforcement Learning with Information-Theoretic Actuation	Sep 30, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Classical Planning: Viewing Heuristics as Dense Reward Generators	Sep 30, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Bitcoin Transaction Strategy Construction Based on Deep Reinforcement Learning	Sep 30, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Decentralized Graph-Based Multi-Agent Reinforcement Learning Using Reward Machines	Sep 30, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
A Privacy-preserving Distributed Training Framework for Cooperative Multi-agent Deep Reinforcement Learning	Sep 30, 2021	Deep Reinforcement LearningPrivacy Preserving	—Unverified
Coordinated Reinforcement Learning for Optimizing Mobile Networks	Sep 30, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
HLIC: Harmonizing Optimization Metrics in Learned Image Compression by Reinforcement Learning	Sep 30, 2021	Image CompressionMS-SSIM	—Unverified
A Flexible Measurement of Diversity in Datasets with Random Network Distillation	Sep 29, 2021	DiversityImage Generation	—Unverified
Generalisation in Lifelong Reinforcement Learning through Logical Composition	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified
Detecting Worst-case Corruptions via Loss Landscape Curvature in Deep Reinforcement Learning	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Coordinated Attacks Against Federated Learning: A Multi-Agent Reinforcement Learning Approach	Sep 29, 2021	Federated LearningMulti-agent Reinforcement Learning	—Unverified
An Attempt to Model Human Trust with Reinforcement Learning	Sep 29, 2021	Decision MakingQ-Learning	—Unverified
Fully Decentralized Model-based Policy Optimization with Networked Agents	Sep 29, 2021	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
Information-Bottleneck-Based Behavior Representation Learning for Multi-agent Reinforcement learning	Sep 29, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Learning Pseudometric-based Action Representations for Offline Reinforcement Learning	Sep 29, 2021	Offline RLRecommendation Systems	—Unverified

Show:10 25 50

← PrevPage 164 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified