Multiple-choice

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 876–900 of 1107 papers

Title	Date	Tasks	Status
Controlling Cloze-test Question Item Difficulty with PLM-based Surrogate Models for IRT Assessment	Mar 3, 2024	Cloze TestMultiple-choice	—Unverified
Conversational Assistants and Gender Stereotypes: Public Perceptions and Desiderata for Voice Personas	Dec 1, 2020	Multiple-choice	—Unverified
ACPBench: Reasoning about Action, Change, and Planning	Oct 8, 2024	Multiple-choice	—Unverified
Convolutional Spatial Attention Model for Reading Comprehension with Multiple-Choice Questions	Nov 21, 2018	Machine Reading ComprehensionMultiple-choice	—Unverified
Cosmos QA: Machine Reading Comprehension with Contextual Commonsense Reasoning	Aug 31, 2019	Machine Reading ComprehensionMultiple-choice	—Unverified
CP-Router: An Uncertainty-Aware Router Between LLM and LRM	May 26, 2025	Conformal PredictionLogical Reasoning	—Unverified
Cracking the Code: Multi-domain LLM Evaluation on Real-World Professional Exams in Indonesia	Sep 13, 2024	MathMultiple-choice	—Unverified
CroaTPAS: A Survey-based Evaluation	Jun 1, 2022	Multiple-choiceSurvey	—Unverified
Template Filling for Controllable Commonsense Reasoning	Oct 31, 2021	Multiple-choice	—Unverified
Crowd Labeling: a survey	Jan 13, 2013	Multiple-choiceSurvey	—Unverified
Crowdsourcing Multiple Choice Science Questions	Jul 19, 2017	DiversityMultiple-choice	—Unverified
CS-NLP team at SemEval-2020 Task 4: Evaluation of State-of-the-art NLP Deep Learning Architectures on Commonsense Reasoning Task	May 17, 2020	Multiple-choiceNatural Language Inference	—Unverified
CSReader at SemEval-2018 Task 11: Multiple Choice Question Answering as Textual Entailment	Jun 1, 2018	Common Sense ReasoningLanguage Modelling	—Unverified
Tokenization Standards for Linguistic Integrity: Turkish as a Benchmark	Feb 10, 2025	MMLUMorphological Analysis	—Unverified
A Neural Question Answering Model Based on Semi-Structured Tables	Aug 1, 2018	Knowledge GraphsMultiple-choice	—Unverified
Zero-shot Event Causality Identification with Question Answering	Sep 1, 2022	ArticlesEvent Causality Identification	—Unverified
DARE: Diverse Visual Question Answering with Robustness Evaluation	Sep 26, 2024	image-classificationImage Classification	—Unverified
ACPBench Hard: Unrestrained Reasoning about Action, Change, and Planning	Mar 31, 2025	Multiple-choice	—Unverified
Dataset Bias Mitigation in Multiple-Choice Visual Question Answering and Beyond	Oct 23, 2023	counterfactualMultiple-choice	—Unverified
Decision-Making Behavior Evaluation Framework for LLMs under Uncertain Context	Jun 10, 2024	Decision MakingMultiple-choice	—Unverified
Deep learning for sentence clustering in essay grading support	Apr 23, 2021	ClusteringDeep Learning	—Unverified
DeepQR: Neural-based Quality Ratings for Learnersourced Multiple-Choice Questions	Nov 19, 2021	Contrastive LearningMultiple-choice	—Unverified
DeepSeek-R1 Outperforms Gemini 2.0 Pro, OpenAI o1, and o3-mini in Bilingual Complex Ophthalmology Reasoning	Feb 25, 2025	ManagementMultiple-choice	—Unverified
Designing Templates for Eliciting Commonsense Knowledge from Pretrained Sequence-to-Sequence Models	Dec 1, 2020	Multiple-choiceNatural Language Understanding	—Unverified
DeSIQ: Towards an Unbiased, Challenging Benchmark for Social Intelligence Understanding	Oct 24, 2023	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 36 of 45Next →

No leaderboard results yet.