SOTAVerified|Agents Browse Leaderboard About

StrategyQA

StrategyQA aims to measure the ability of models to answer questions that require multi-step implicit reasoning.

Source: BIG-bench

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–40 of 40 papers

Title	Date	Tasks	Status	Hype
Improving Attributed Text Generation of Large Language Models via Preference Learning	Mar 27, 2024	MisinformationRetrieval	—Unverified	0
Large Language Models Are Also Good Prototypical Commonsense Reasoners	Sep 22, 2023	StrategyQA	—Unverified	0
Learning to Decompose: Hypothetical Question Decomposition Based on Comparable Texts	Oct 30, 2022	Language ModelingLanguage Modelling	—Unverified	0
Meta-prompting Optimized Retrieval-augmented Generation	Jul 4, 2024	Multi-hop Question AnsweringQuestion Answering	—Unverified	0
Proof of Thought : Neurosymbolic Program Synthesis allows Robust and Interpretable Reasoning	Sep 25, 2024	BenchmarkingFormal Logic	—Unverified	0
Question-Analysis Prompting Improves LLM Performance in Reasoning Tasks	Jul 4, 2024	GSM8KStrategyQA	—Unverified	0
The ART of LLM Refinement: Ask, Refine, and Trust	Nov 14, 2023	Arithmetic ReasoningGSM8K	—Unverified	0
Towards Uncertainty-Aware Language Agent	Jan 25, 2024	MMLUStrategyQA	—Unverified	0
Unraveling Indirect In-Context Learning Using Influence Functions	Jan 1, 2025	In-Context LearningInformativeness	—Unverified	0
DeLTa: A Decoding Strategy based on Logit Trajectory Prediction Improves Factuality and Reasoning Ability	Mar 4, 2025	GSM8KLogical Reasoning	CodeCode Available	0
Rationale-Aware Answer Verification by Pairwise Self-Evaluation	Oct 7, 2024	ARCStrategyQA	CodeCode Available	0
Distilling Reasoning Capabilities into Smaller Language Models	Dec 1, 2022	GSM8KKnowledge Distillation	CodeCode Available	0
Tailoring Self-Rationalizers with Multi-Reward Distillation	Nov 6, 2023	DiversityQuestion Answering	CodeCode Available	0
Teaching Smaller Language Models To Generalise To Unseen Compositional Questions	Aug 2, 2023	ARCInformation Retrieval	CodeCode Available	0
Voting or Consensus? Decision-Making in Multi-Agent Debate	Feb 26, 2025	Decision MakingMMLU	CodeCode Available	0

Show:10 25 50

← PrevPage 2 of 2Next →

No leaderboard results yet.