SOTAVerified|Agents Browse Leaderboard About

StrategyQA

StrategyQA aims to measure the ability of models to answer questions that require multi-step implicit reasoning.

Source: BIG-bench

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 21–30 of 40 papers

Title	Date	Tasks	Status	Hype
Rationale-Aware Answer Verification by Pairwise Self-Evaluation	Oct 7, 2024	ARCStrategyQA	CodeCode Available	0
A Looming Replication Crisis in Evaluating Behavior in Language Models? Evidence and Solutions	Sep 30, 2024	Prompt EngineeringStrategyQA	—Unverified	0
Proof of Thought : Neurosymbolic Program Synthesis allows Robust and Interpretable Reasoning	Sep 25, 2024	BenchmarkingFormal Logic	—Unverified	0
Meta-prompting Optimized Retrieval-augmented Generation	Jul 4, 2024	Multi-hop Question AnsweringQuestion Answering	—Unverified	0
Question-Analysis Prompting Improves LLM Performance in Reasoning Tasks	Jul 4, 2024	GSM8KStrategyQA	—Unverified	0
Advancing Process Verification for Large Language Models via Tree-Based Preference Learning	Jun 29, 2024	Binary ClassificationGSM8K	—Unverified	0
Improving Attributed Text Generation of Large Language Models via Preference Learning	Mar 27, 2024	MisinformationRetrieval	—Unverified	0
Towards Uncertainty-Aware Language Agent	Jan 25, 2024	MMLUStrategyQA	—Unverified	0
IAG: Induction-Augmented Generation Framework for Answering Reasoning Questions	Nov 30, 2023	Knowledge DistillationRAG	—Unverified	0
The ART of LLM Refinement: Ask, Refine, and Trust	Nov 14, 2023	Arithmetic ReasoningGSM8K	—Unverified	0

Show:10 25 50

← PrevPage 3 of 4Next →

No leaderboard results yet.