Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9251–9300 of 15113 papers

Title	Date	Tasks	Status	Hype
Reinforcement Learning Agents for Ubisoft's Roller Champions	Dec 10, 2020	Cultural Vocal Bursts Intensity Predictionreinforcement-learning	—Unverified	0
A Deep Reinforcement Learning Approach for Ramp Metering Based on Traffic Video Data	Dec 9, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Deep Reinforcement Learning for Long Term Hydropower Production Scheduling	Dec 9, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Stock Portfolio Optimization	Dec 9, 2020	Deep Reinforcement LearningPortfolio Optimization	—Unverified	0
Interactive Search Based on Deep Reinforcement Learning	Dec 9, 2020	ClusteringDecision Making	—Unverified	0
Robust Domain Randomised Reinforcement Learning through Peer-to-Peer Distillation	Dec 9, 2020	continuous-controlContinuous Control	—Unverified	0
Semi-Supervised Off Policy Reinforcement Learning	Dec 9, 2020	ImputationQ-Learning	—Unverified	0
Transfer Learning for Efficient Iterative Safety Validation	Dec 9, 2020	Autonomous Drivingreinforcement-learning	—Unverified	0
MLComp: A Methodology for Machine Learning-based Performance Estimation and Adaptive Selection of Pareto-Optimal Compiler Optimization Sequences	Dec 9, 2020	Compiler Optimizationreinforcement-learning	—Unverified	0
Resolving Implicit Coordination in Multi-Agent Deep Reinforcement Learning with Deep Q-Networks & Game Theory	Dec 8, 2020	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	0
Emergence of Different Modes of Tool Use in a Reaching and Dragging Task	Dec 8, 2020	Deep Reinforcement LearningFriction	—Unverified	0
Combining Reinforcement Learning with Lin-Kernighan-Helsgaun Algorithm for the Traveling Salesman Problem	Dec 8, 2020	Combinatorial OptimizationQ-Learning	CodeCode Available	1
NavRep: Unsupervised Representations for Reinforcement Learning of Robot Navigation in Dynamic Human Environments	Dec 8, 2020	OpenAI Gymreinforcement-learning	CodeCode Available	1
The Architectural Implications of Distributed Reinforcement Learning on CPU-GPU Systems	Dec 8, 2020	CPUDeep Reinforcement Learning	—Unverified	0
Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual Model-Based Reinforcement Learning	Dec 8, 2020	Model-based Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Vehicular Cooperative Perception Through Action Branching and Federated Reinforcement Learning	Dec 7, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Selective Pseudo-Labeling with Reinforcement Learning for Semi-Supervised Domain Adaptation	Dec 7, 2020	Domain AdaptationQ-Learning	—Unverified	0
Reset-Free Lifelong Learning with Skill-Space Planning	Dec 7, 2020	Lifelong learningMuJoCo	CodeCode Available	1
Efficient Reservoir Management through Deep Reinforcement Learning	Dec 7, 2020	Deep Reinforcement LearningManagement	—Unverified	0
GAEA: Graph Augmentation for Equitable Access via Reinforcement Learning	Dec 7, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Battery Model Calibration with Deep Reinforcement Learning	Dec 7, 2020	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified	0
Fever Basketball: A Complex, Flexible, and Asynchronized Sports Game Environment for Multi-agent Reinforcement Learning	Dec 6, 2020	Board GamesDeep Reinforcement Learning	—Unverified	0
Multi-agent navigation based on deep reinforcement learning and traditional pathfinding algorithm	Dec 5, 2020	Collision AvoidanceDeep Reinforcement Learning	—Unverified	0
RLOC: Terrain-Aware Legged Locomotion using Reinforcement Learning and Optimal Control	Dec 5, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Data Boost: Text Data Augmentation Through Reinforcement Learning Guided Conditional Generation	Dec 5, 2020	Data Augmentationreinforcement-learning	—Unverified	0
ACN-Sim: An Open-Source Simulator for Data-Driven Electric Vehicle Charging Research	Dec 4, 2020	OpenAI GymReinforcement Learning (RL)	CodeCode Available	1
Demonstration-efficient Inverse Reinforcement Learning in Procedurally Generated Environments	Dec 4, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Neural Dynamic Policies for End-to-End Sensorimotor Learning	Dec 4, 2020	Imitation Learningreinforcement-learning	—Unverified	0
Offline Meta-level Model-based Reinforcement Learning Approach for Cold-Start Recommendation	Dec 4, 2020	Model-based Reinforcement LearningRecommendation Systems	—Unverified	0
Model-Agnostic Learning to Meta-Learn	Dec 4, 2020	image-classificationImage Classification	—Unverified	0
Partially Connected Automated Vehicle Cooperative Control Strategy with a Deep Reinforcement Learning Approach	Dec 3, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
DeepCrawl: Deep Reinforcement Learning for Turn-based Strategy Games	Dec 3, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Emergent Complexity and Zero-shot Transfer via Unsupervised Environment Design	Dec 3, 2020	Reinforcement Learning (RL)Transfer Learning	CodeCode Available	0
Dynamic RAN Slicing for Service-Oriented Vehicular Networks via Constrained Learning	Dec 3, 2020	Reinforcement Learning (RL)	—Unverified	0
Designing a Prospective COVID-19 Therapeutic with Reinforcement Learning	Dec 3, 2020	Deep Reinforcement LearningProtein Design	—Unverified	0
Sample Complexity of Policy Gradient Finding Second-Order Stationary Points	Dec 2, 2020	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified	0
Pareto Deterministic Policy Gradients and Its Application in 5G Massive MIMO Networks	Dec 2, 2020	Reinforcement Learning (RL)	—Unverified	0
A Safe Reinforcement Learning Architecture for Antenna Tilt Optimisation	Dec 2, 2020	Managementreinforcement-learning	—Unverified	0
Convergence Proof for Actor-Critic Methods Applied to PPO and RUDDER	Dec 2, 2020	Reinforcement Learning (RL)valid	—Unverified	0
Driving-Policy Adaptive Safeguard for Autonomous Vehicles Using Reinforcement Learning	Dec 2, 2020	Autonomous VehiclesCollision Avoidance	—Unverified	0
Coinbot: Intelligent Robotic Coin Bag Manipulation Using Deep Reinforcement Learning And Machine Teaching	Dec 2, 2020	Deep Reinforcement LearningMotion Planning	—Unverified	0
Are Gradient-based Saliency Maps Useful in Deep Reinforcement Learning?	Dec 2, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
BSODA: A Bipartite Scalable Framework for Online Disease Diagnosis	Dec 2, 2020	Disease PredictionReinforcement Learning (RL)	—Unverified	0
Improving the Naturalness and Diversity of Referring Expression Generation models using Minimum Risk Training	Dec 1, 2020	DiversityReferring Expression	—Unverified	0
Improving Neural Machine Translation for Sanskrit-English	Dec 1, 2020	Machine Translationreinforcement-learning	—Unverified	0
Combining Cognitive Modeling and Reinforcement Learning for Clarification in Dialogue	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Answer-driven Deep Question Generation based on Reinforcement Learning	Dec 1, 2020	DecoderQuestion Generation	—Unverified	0
A Learning-Exploring Method to Generate Diverse Paraphrases with Multi-Objective Deep Reinforcement Learning	Dec 1, 2020	Deep Reinforcement LearningDiversity	—Unverified	0
ExpanRL: Hierarchical Reinforcement Learning for Course Concept Expansion in MOOCs	Dec 1, 2020	DiversityHierarchical Reinforcement Learning	—Unverified	0
Text Simplification with Reinforcement Learning Using Supervised Rewards on Grammaticality, Meaning Preservation, and Simplicity	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 186 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified