SOTAVerified|Agents Browse Leaderboard About

mbpp

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–110 of 129 papers

Title	Date	Tasks	Status	Hype
Code-Optimise: Self-Generated Preference Data for Correctness and Efficiency	Jun 18, 2024	HumanEvalmbpp	—Unverified	0
Evaluating LLM-driven User-Intent Formalization for Verification-Aware Languages	Jun 14, 2024	Code Generationmbpp	—Unverified	0
PLUM: Improving Code LMs with Execution-Guided On-Policy Preference Learning Driven By Synthetic Test Cases	Jun 11, 2024	Code GenerationHumanEval	—Unverified	0
Divide-and-Conquer Meets Consensus: Unleashing the Power of Functions in Code Generation	May 30, 2024	Code GenerationHumanEval	—Unverified	0
Uncovering LLM-Generated Code: A Zero-Shot Synthetic Code Detector via Code Rewriting	May 25, 2024	Contrastive Learningmbpp	—Unverified	0
NExT: Teaching Large Language Models to Reason about Code Execution	Apr 23, 2024	HumanEvalmbpp	—Unverified	0
Comments as Natural Logic Pivots: Improve Code Generation via Comment Perspective	Apr 11, 2024	Code GenerationHumanEval	CodeCode Available	0
SOEN-101: Code Generation by Emulating Software Process Models Using Large Language Model Agents	Mar 23, 2024	Code GenerationHumanEval	—Unverified	0
Software Vulnerability and Functionality Assessment using LLMs	Mar 13, 2024	Code GenerationHumanEval	—Unverified	0
LiveCodeBench: Holistic and Contamination Free Evaluation of Large Language Models for Code	Mar 12, 2024	Code GenerationHumanEval	—Unverified	0

Show:10 25 50

← PrevPage 11 of 13Next →

No leaderboard results yet.