Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9901–9925 of 15113 papers

Title	Date	Tasks	Status
Semi-Supervised Off Policy Reinforcement Learning	Dec 9, 2020	ImputationQ-Learning	—Unverified
The Architectural Implications of Distributed Reinforcement Learning on CPU-GPU Systems	Dec 8, 2020	CPUDeep Reinforcement Learning	—Unverified
Resolving Implicit Coordination in Multi-Agent Deep Reinforcement Learning with Deep Q-Networks & Game Theory	Dec 8, 2020	Deep Reinforcement LearningOpenAI Gym	CodeCode Available
Emergence of Different Modes of Tool Use in a Reaching and Dragging Task	Dec 8, 2020	Deep Reinforcement LearningFriction	—Unverified
Efficient Reservoir Management through Deep Reinforcement Learning	Dec 7, 2020	Deep Reinforcement LearningManagement	—Unverified
Battery Model Calibration with Deep Reinforcement Learning	Dec 7, 2020	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Selective Pseudo-Labeling with Reinforcement Learning for Semi-Supervised Domain Adaptation	Dec 7, 2020	Domain AdaptationQ-Learning	—Unverified
Vehicular Cooperative Perception Through Action Branching and Federated Reinforcement Learning	Dec 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Fever Basketball: A Complex, Flexible, and Asynchronized Sports Game Environment for Multi-agent Reinforcement Learning	Dec 6, 2020	Board GamesDeep Reinforcement Learning	—Unverified
Data Boost: Text Data Augmentation Through Reinforcement Learning Guided Conditional Generation	Dec 5, 2020	Data Augmentationreinforcement-learning	—Unverified
Multi-agent navigation based on deep reinforcement learning and traditional pathfinding algorithm	Dec 5, 2020	Collision AvoidanceDeep Reinforcement Learning	—Unverified
Neural Dynamic Policies for End-to-End Sensorimotor Learning	Dec 4, 2020	Imitation Learningreinforcement-learning	—Unverified
Offline Meta-level Model-based Reinforcement Learning Approach for Cold-Start Recommendation	Dec 4, 2020	Model-based Reinforcement LearningRecommendation Systems	—Unverified
Model-Agnostic Learning to Meta-Learn	Dec 4, 2020	image-classificationImage Classification	—Unverified
Demonstration-efficient Inverse Reinforcement Learning in Procedurally Generated Environments	Dec 4, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Emergent Complexity and Zero-shot Transfer via Unsupervised Environment Design	Dec 3, 2020	Reinforcement Learning (RL)Transfer Learning	CodeCode Available
Dynamic RAN Slicing for Service-Oriented Vehicular Networks via Constrained Learning	Dec 3, 2020	Reinforcement Learning (RL)	—Unverified
DeepCrawl: Deep Reinforcement Learning for Turn-based Strategy Games	Dec 3, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Designing a Prospective COVID-19 Therapeutic with Reinforcement Learning	Dec 3, 2020	Deep Reinforcement LearningProtein Design	—Unverified
Partially Connected Automated Vehicle Cooperative Control Strategy with a Deep Reinforcement Learning Approach	Dec 3, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Safe Reinforcement Learning Architecture for Antenna Tilt Optimisation	Dec 2, 2020	Managementreinforcement-learning	—Unverified
Pareto Deterministic Policy Gradients and Its Application in 5G Massive MIMO Networks	Dec 2, 2020	Reinforcement Learning (RL)	—Unverified
Sample Complexity of Policy Gradient Finding Second-Order Stationary Points	Dec 2, 2020	Policy Gradient MethodsReinforcement Learning (RL)	—Unverified
Coinbot: Intelligent Robotic Coin Bag Manipulation Using Deep Reinforcement Learning And Machine Teaching	Dec 2, 2020	Deep Reinforcement LearningMotion Planning	—Unverified
Convergence Proof for Actor-Critic Methods Applied to PPO and RUDDER	Dec 2, 2020	Reinforcement Learning (RL)valid	—Unverified

Show:10 25 50

← PrevPage 397 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified