Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9901–9950 of 15113 papers

Title	Date	Tasks	Status
Semi-Supervised Off Policy Reinforcement Learning	Dec 9, 2020	ImputationQ-Learning	—Unverified
The Architectural Implications of Distributed Reinforcement Learning on CPU-GPU Systems	Dec 8, 2020	CPUDeep Reinforcement Learning	—Unverified
Resolving Implicit Coordination in Multi-Agent Deep Reinforcement Learning with Deep Q-Networks & Game Theory	Dec 8, 2020	Deep Reinforcement LearningOpenAI Gym	CodeCode Available
Emergence of Different Modes of Tool Use in a Reaching and Dragging Task	Dec 8, 2020	Deep Reinforcement LearningFriction	—Unverified
Efficient Reservoir Management through Deep Reinforcement Learning	Dec 7, 2020	Deep Reinforcement LearningManagement	—Unverified
Battery Model Calibration with Deep Reinforcement Learning	Dec 7, 2020	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Selective Pseudo-Labeling with Reinforcement Learning for Semi-Supervised Domain Adaptation	Dec 7, 2020	Domain AdaptationQ-Learning	—Unverified
Vehicular Cooperative Perception Through Action Branching and Federated Reinforcement Learning	Dec 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Fever Basketball: A Complex, Flexible, and Asynchronized Sports Game Environment for Multi-agent Reinforcement Learning	Dec 6, 2020	Board GamesDeep Reinforcement Learning	—Unverified
Data Boost: Text Data Augmentation Through Reinforcement Learning Guided Conditional Generation	Dec 5, 2020	Data Augmentationreinforcement-learning	—Unverified
Multi-agent navigation based on deep reinforcement learning and traditional pathfinding algorithm	Dec 5, 2020	Collision AvoidanceDeep Reinforcement Learning	—Unverified
Neural Dynamic Policies for End-to-End Sensorimotor Learning	Dec 4, 2020	Imitation Learningreinforcement-learning	—Unverified
Offline Meta-level Model-based Reinforcement Learning Approach for Cold-Start Recommendation	Dec 4, 2020	Model-based Reinforcement LearningRecommendation Systems	—Unverified
Model-Agnostic Learning to Meta-Learn	Dec 4, 2020	image-classificationImage Classification	—Unverified
Demonstration-efficient Inverse Reinforcement Learning in Procedurally Generated Environments	Dec 4, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Emergent Complexity and Zero-shot Transfer via Unsupervised Environment Design	Dec 3, 2020	Reinforcement Learning (RL)Transfer Learning	CodeCode Available
Dynamic RAN Slicing for Service-Oriented Vehicular Networks via Constrained Learning	Dec 3, 2020	Reinforcement Learning (RL)	—Unverified
DeepCrawl: Deep Reinforcement Learning for Turn-based Strategy Games	Dec 3, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Designing a Prospective COVID-19 Therapeutic with Reinforcement Learning	Dec 3, 2020	Deep Reinforcement LearningProtein Design	—Unverified
Partially Connected Automated Vehicle Cooperative Control Strategy with a Deep Reinforcement Learning Approach	Dec 3, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Safe Reinforcement Learning Architecture for Antenna Tilt Optimisation	Dec 2, 2020	Managementreinforcement-learning	—Unverified
Pareto Deterministic Policy Gradients and Its Application in 5G Massive MIMO Networks	Dec 2, 2020	Reinforcement Learning (RL)	—Unverified
Sample Complexity of Policy Gradient Finding Second-Order Stationary Points	Dec 2, 2020	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Coinbot: Intelligent Robotic Coin Bag Manipulation Using Deep Reinforcement Learning And Machine Teaching	Dec 2, 2020	Deep Reinforcement LearningMotion Planning	—Unverified
Convergence Proof for Actor-Critic Methods Applied to PPO and RUDDER	Dec 2, 2020	Reinforcement Learning (RL)valid	—Unverified
Driving-Policy Adaptive Safeguard for Autonomous Vehicles Using Reinforcement Learning	Dec 2, 2020	Autonomous VehiclesCollision Avoidance	—Unverified
Are Gradient-based Saliency Maps Useful in Deep Reinforcement Learning?	Dec 2, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
BSODA: A Bipartite Scalable Framework for Online Disease Diagnosis	Dec 2, 2020	Disease PredictionReinforcement Learning (RL)	—Unverified
Combining Cognitive Modeling and Reinforcement Learning for Clarification in Dialogue	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Is Long Horizon RL More Difficult Than Short Horizon RL?	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
ExpanRL: Hierarchical Reinforcement Learning for Course Concept Expansion in MOOCs	Dec 1, 2020	DiversityHierarchical Reinforcement Learning	—Unverified
EcoLight: Intersection Control in Developing Regions Under Extreme Budget and Network Constraints	Dec 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Improving Neural Machine Translation for Sanskrit-English	Dec 1, 2020	Machine Translationreinforcement-learning	—Unverified
Improving the Naturalness and Diversity of Referring Expression Generation models using Minimum Risk Training	Dec 1, 2020	DiversityReferring Expression	—Unverified
Almost Optimal Model-Free Reinforcement Learningvia Reference-Advantage Decomposition	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Assessing and Accelerating Coverage in Deep Reinforcement Learning	Dec 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Instance-based Generalization in Reinforcement Learning	Dec 1, 2020	Deep Reinforcement LearningGeneralization Bounds	—Unverified
Leverage the Average: an Analysis of KL Regularization in Reinforcement Learning	Dec 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Answer-driven Deep Question Generation based on Reinforcement Learning	Dec 1, 2020	DecoderQuestion Generation	—Unverified
A Local Temporal Difference Code for Distributional Reinforcement Learning	Dec 1, 2020	Distributional Reinforcement LearningImputation	—Unverified
A Learning-Exploring Method to Generate Diverse Paraphrases with Multi-Objective Deep Reinforcement Learning	Dec 1, 2020	Deep Reinforcement LearningDiversity	—Unverified
A new convergent variant of Q-learning with linear function approximation	Dec 1, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Can Temporal-Diﬀerence and Q-Learning Learn Representation? A Mean-Field Theory	Dec 1, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Robust Multi-Agent Reinforcement Learning with Model Uncertainty	Dec 1, 2020	modelMulti-agent Reinforcement Learning	—Unverified
Promoting Stochasticity for Expressive Policies via a Simple and Efficient Regularization Method	Dec 1, 2020	continuous-controlContinuous Control	—Unverified
Security Analysis of Safe and Seldonian Reinforcement Learning Algorithms	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
R-learning in actor-critic model offers a biologically relevant mechanism for sequential decision-making	Dec 1, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
RL Unplugged: A Collection of Benchmarks for Offline Reinforcement Learning	Dec 1, 2020	Offline RLreinforcement-learning	CodeCode Available
Text Simplification with Reinforcement Learning Using Supervised Rewards on Grammaticality, Meaning Preservation, and Simplicity	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
On Efficiency in Hierarchical Reinforcement Learning	Dec 1, 2020	Computational EfficiencyDecision Making	—Unverified

Show:10 25 50

← PrevPage 199 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified