SOTAVerified|Agents Browse Leaderboard About

StrategyQA

StrategyQA aims to measure the ability of models to answer questions that require multi-step implicit reasoning.

Source: BIG-bench

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–40 of 40 papers

Title	Date	Tasks	Status	Hype
Advancing Process Verification for Large Language Models via Tree-Based Preference Learning	Jun 29, 2024	Binary ClassificationGSM8K	—Unverified	0
Improving Attributed Text Generation of Large Language Models via Preference Learning	Mar 27, 2024	MisinformationRetrieval	—Unverified	0
Towards Uncertainty-Aware Language Agent	Jan 25, 2024	MMLUStrategyQA	—Unverified	0
IAG: Induction-Augmented Generation Framework for Answering Reasoning Questions	Nov 30, 2023	Knowledge DistillationRAG	—Unverified	0
The ART of LLM Refinement: Ask, Refine, and Trust	Nov 14, 2023	Arithmetic ReasoningGSM8K	—Unverified	0
Tailoring Self-Rationalizers with Multi-Reward Distillation	Nov 6, 2023	DiversityQuestion Answering	CodeCode Available	0
Large Language Models Are Also Good Prototypical Commonsense Reasoners	Sep 22, 2023	StrategyQA	—Unverified	0
Answering Unseen Questions With Smaller Language Models Using Rationale Generation and Dense Retrieval	Aug 9, 2023	ARCLanguage Modelling	—Unverified	0
Teaching Smaller Language Models To Generalise To Unseen Compositional Questions	Aug 2, 2023	ARCInformation Retrieval	CodeCode Available	0
Deduction under Perturbed Evidence: Probing Student Simulation Capabilities of Large Language Models	May 23, 2023	Logical ReasoningStrategyQA	—Unverified	0
Hint of Thought prompting: an explainable and zero-shot approach to reasoning tasks with LLMs	May 19, 2023	Arithmetic ReasoningGSM8K	—Unverified	0
Self-Evaluation Guided Beam Search for Reasoning	May 1, 2023	Arithmetic ReasoningGSM8K	—Unverified	0
Distilling Reasoning Capabilities into Smaller Language Models	Dec 1, 2022	GSM8KKnowledge Distillation	CodeCode Available	0
Learning to Decompose: Hypothetical Question Decomposition Based on Comparable Texts	Oct 30, 2022	Language ModelingLanguage Modelling	—Unverified	0
Better Retrieval May Not Lead to Better Question Answering	May 7, 2022	Information RetrievalOpen-Domain Question Answering	—Unverified	0

Show:10 25 50

← PrevPage 2 of 2Next →

No leaderboard results yet.