SOTAVerified|Agents Browse Leaderboard About Blog

Task Planning

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11–20 of 344 papers

Title	Date	Tasks	Status	Hype
Tool Learning with Large Language Models: A Survey	May 28, 2024	Response GenerationSurvey	CodeCode Available	3
AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases	Jul 17, 2024	Autonomous DrivingBackdoor Attack	CodeCode Available	3
D-CIPHER: Dynamic Collaborative Intelligent Multi-Agent System with Planner and Heterogeneous Executors for Offensive Security	Feb 15, 2025	Task Planning	CodeCode Available	2
Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents	Feb 3, 2023	MinecraftTask Planning	CodeCode Available	2
LLM3:Large Language Model-based Task and Motion Planning with Motion Failure Reasoning	Mar 18, 2024	Language ModelingLanguage Modelling	CodeCode Available	2
COHERENT: Collaboration of Heterogeneous Multi-Robot System with Large Language Models	Sep 23, 2024	Robot Task PlanningTask Planning	CodeCode Available	2
LoTa-Bench: Benchmarking Language-oriented Task Planners for Embodied Agents	Feb 13, 2024	BenchmarkingModel Selection	CodeCode Available	2
Can Graph Learning Improve Planning in LLM-based Agents?	May 29, 2024	Decision MakingGraph Learning	CodeCode Available	2
Getting pwn'd by AI: Penetration Testing with Large Language Models	Jul 24, 2023	EthicsTask Planning	CodeCode Available	2
GTA1: GUI Test-time Scaling Agent	Jul 8, 2025	Reinforcement Learning (RL)Task Planning	CodeCode Available	2

Show:10 25 50

← PrevPage 2 of 35Next →

No leaderboard results yet.