Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11076–11100 of 15113 papers

Title	Date	Tasks	Status
General Method for Solving Four Types of SAT Problems	Dec 27, 2023	reinforcement-learningReinforcement Learning	—Unverified
General sum stochastic games with networked information flows	May 5, 2022	Decision MakingManagement	—Unverified
Generate and Revise: Reinforcement Learning in Neural Poetry	Feb 8, 2021	reinforcement-learningReinforcement Learning	—Unverified
Generating and Evolving Reward Functions for Highway Driving with Large Language Models	Jun 15, 2024	Autonomous DrivingReinforcement Learning (RL)	—Unverified
Generating Black-Box Adversarial Examples for Text Classifiers Using a Deep Reinforced Model	Sep 17, 2019	reinforcement-learningReinforcement Learning	—Unverified
Generating Critical Scenarios for Testing Automated Driving Systems	Dec 3, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified
Generating Explanations from Deep Reinforcement Learning Using Episodic Memory	May 18, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Generating Formality-Tuned Summaries Using Input-Dependent Rewards	Nov 1, 2019	Abstractive Text Summarizationreinforcement-learning	—Unverified
Generating GPU Compiler Heuristics using Reinforcement Learning	Nov 23, 2021	Deep Reinforcement LearningGPU	—Unverified
Generating Interpretable Fuzzy Controllers using Particle Swarm Optimization and Genetic Programming	Apr 29, 2018	reinforcement-learningReinforcement Learning	—Unverified
Generating Paraphrases with Lean Vocabulary	Oct 1, 2019	Paraphrase Generationreinforcement-learning	—Unverified
Improving Factual Consistency Between a Response and Persona Facts	Apr 30, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Generating Rescheduling Knowledge using Reinforcement Learning in a Cognitive Architecture	May 12, 2018	reinforcement-learningReinforcement Learning	—Unverified
Generating Socially Acceptable Perturbations for Efficient Evaluation of Autonomous Vehicles	Mar 18, 2020	Autonomous VehiclesDecision Making	—Unverified
Generating stable molecules using imitation and reinforcement learning	Jul 11, 2021	Imitation Learningreinforcement-learning	—Unverified
Generating Student Feedback from Time-Series Data Using Reinforcement Learning	Aug 1, 2013	Data-to-Text Generationreinforcement-learning	—Unverified
Generating Text with Deep Reinforcement Learning	Oct 30, 2015	DecoderDeep Reinforcement Learning	—Unverified
Generation of Policy-Level Explanations for Reinforcement Learning	May 28, 2019	reinforcement-learningReinforcement Learning	—Unverified
Generative Adversarial Exploration for Reinforcement Learning	Jan 27, 2022	Generative Adversarial NetworkMontezuma's Revenge	—Unverified
Generative Adversarial Imagination for Sample Efficient Deep Reinforcement Learning	Apr 30, 2019	Deep Reinforcement LearningGame of Go	—Unverified
Generative Adversarial Imitation Learning with Neural Networks: Global Optimality and Convergence Rate	Mar 8, 2020	Imitation Learningreinforcement-learning	—Unverified
Generative Adversarial Imitation Learning with Neural Network Parameterization: Global Optimality and Convergence Rate	Jan 1, 2020	Imitation Learningreinforcement-learning	—Unverified
Generative Adversarial Imitation Learning for End-to-End Autonomous Driving on Urban Environments	Oct 16, 2021	Autonomous DrivingAutonomous Navigation	—Unverified
Generative Adversarial Reward Learning for Generalized Behavior Tendency Inference	May 3, 2021	Recommendation Systemsreinforcement-learning	—Unverified
Generative Adversarial Self-Imitation Learning	Dec 3, 2018	Imitation LearningMuJoCo	—Unverified

Show:10 25 50

← PrevPage 444 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified