Open-Ended Question Answering

Open-ended questions are defined as those that simply pose the question, without imposing any constraints on the format of the response. This distinguishes them from questions with a predetermined answer format.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 796 papers

Title	Date	Tasks	Status	Hype
VersaVid-R1: A Versatile Video Understanding and Reasoning Model from Question Answering to Captioning Tasks	Jun 10, 2025	Multiple-choiceOpen-Ended Question Answering	—Unverified	0
WIP: Large Language Model-Enhanced Smart Tutor for Undergraduate Circuit Analysis	Jun 10, 2025	Language ModelingLanguage Modelling	—Unverified	0
anyECG-chat: A Generalist ECG-MLLM for Flexible ECG Input and Multi-Task Understanding	Jun 1, 2025	Open-Ended Question AnsweringQuestion Answering	—Unverified	0
CulFiT: A Fine-grained Cultural-aware LLM Training Paradigm via Multilingual Critique Data Synthesis	May 26, 2025	DiversityOpen-Ended Question Answering	CodeCode Available	0
O^2-Searcher: A Searching-based Agent Model for Open-Domain Open-Ended Question Answering	May 22, 2025	Answer GenerationOpen-Ended Question Answering	CodeCode Available	1
TinyRS-R1: Compact Multimodal Language Model for Remote Sensing	May 17, 2025	Language ModelingLanguage Modelling	—Unverified	0
Ranked Voting based Self-Consistency of Large Language Models	May 16, 2025	Multiple-choiceOpen-Ended Question Answering	CodeCode Available	1
VLM Q-Learning: Aligning Vision-Language Models for Interactive Decision-Making	May 6, 2025	Decision MakingGeneral Knowledge	—Unverified	0
Accommodate Knowledge Conflicts in Retrieval-augmented LLMs: Towards Reliable Response Generation in the Wild	Apr 17, 2025	Decision MakingInformation Retrieval	—Unverified	0
AutoDrive-QA- Automated Generation of Multiple-Choice Questions for Autonomous Driving Datasets Using Large Vision-Language Models	Mar 20, 2025	Autonomous DrivingMultiple-choice	—Unverified	0
Time-MQA: Time Series Multi-Task Question Answering with Context Enhancement	Feb 26, 2025	Anomaly DetectionNatural Language Queries	—Unverified	0
FSPO: Few-Shot Preference Optimization of Synthetic Preference Data in LLMs Elicits Effective Personalization to Real Users	Feb 26, 2025	In-Context LearningMeta-Learning	CodeCode Available	1
PRIV-QA: Privacy-Preserving Question Answering for Cloud Large Language Models	Feb 19, 2025	Open-Ended Question AnsweringPrivacy Preserving	CodeCode Available	0
Neptune: The Long Orbit to Benchmarking Long Video Understanding	Dec 12, 2024	BenchmarkingMultimodal Reasoning	CodeCode Available	2
Can Knowledge Graphs Make Large Language Models More Trustworthy? An Empirical Study over Open-ended Question Answering	Oct 10, 2024	HallucinationKnowledge Graphs	—Unverified	0
TVBench: Redesigning Video-Language Evaluation	Oct 10, 2024	Multiple-choiceOpen-Ended Question Answering	—Unverified	0
Utilize the Flow before Stepping into the Same River Twice: Certainty Represented Knowledge Flow for Refusal-Aware Instruction Tuning	Oct 9, 2024	HallucinationMultiple-choice	CodeCode Available	0
Video Instruction Tuning With Synthetic Data	Oct 3, 2024	3D Question Answering (3D-QA)	—Unverified	0
CamelEval: Advancing Culturally Aligned Arabic Language Models and Benchmarks	Sep 19, 2024	Instruction FollowingOpen-Ended Question Answering	—Unverified	0
Ranking Generated Answers: On the Agreement of Retrieval Models with Humans on Consumer Health Questions	Aug 19, 2024	Open-Ended Question AnsweringQuestion Answering	CodeCode Available	0
Reference-Guided Verdict: LLMs-as-Judges in Automatic Evaluation of Free-Form Text	Aug 17, 2024	DiversityForm	—Unverified	0
TelecomGPT: A Framework to Build Telecom-Specfic Large Language Models	Jul 12, 2024	Code GenerationMath	—Unverified	0
LLaSA: A Multimodal LLM for Human Activity Analysis Through Wearable and Smartphone Sensors	Jun 20, 2024	16kInstruction Following	CodeCode Available	1
Extrinsic Evaluation of Cultural Competence in Large Language Models	Jun 17, 2024	Open-Ended Question AnsweringQuestion Answering	CodeCode Available	0
SCAR: Efficient Instruction-Tuning for Large Language Models via Style Consistency-Aware Response Ranking	Jun 16, 2024	Open-Ended Question AnsweringQuestion Answering	CodeCode Available	1
Long Story Short: Story-level Video Understanding from 20K Short Films	Jun 14, 2024	Multiple Choice Question Answering (MCQA)Open-Ended Question Answering	—Unverified	0
Perception of Knowledge Boundary for Large Language Models through Semi-open-ended Question Answering	May 23, 2024	Open-Ended Question AnsweringQuestion Answering	—Unverified	0
Automated Evaluation of Retrieval-Augmented Language Models with Task-Specific Exam Generation	May 22, 2024	InformativenessLanguage Modeling	CodeCode Available	2
SciQAG: A Framework for Auto-Generated Science Question Answering Dataset with Fine-grained Evaluation	May 16, 2024	Open-Ended Question AnsweringQuestion Answering	CodeCode Available	1
Evaluating the Elementary Multilingual Capabilities of Large Language Models with MultiQ	Mar 6, 2024	Open-Ended Question AnsweringQuestion Answering	CodeCode Available	0
API Is Enough: Conformal Prediction for Large Language Models Without Logit-Access	Mar 2, 2024	Conformal PredictionOpen-Ended Question Answering	—Unverified	0
Chain-of-Discussion: A Multi-Model Framework for Complex Evidence-Based Question Answering	Feb 26, 2024	Evidence SelectionOpen-Ended Question Answering	CodeCode Available	4
BiMediX: Bilingual Medical Mixture of Experts LLM	Feb 20, 2024	Mixture-of-ExpertsMultiple-choice	CodeCode Available	1
Enhancing Large Language Models with Pseudo- and Multisource- Knowledge Graphs for Open-ended Question Answering	Feb 15, 2024	Graph GenerationKnowledge Graphs	—Unverified	0
Shai: A large language model for asset management	Dec 21, 2023	Asset ManagementLanguage Modeling	—Unverified	0
On Early Detection of Hallucinations in Factual Question Answering	Dec 19, 2023	HallucinationOpen-Ended Question Answering	CodeCode Available	1
Universal Self-Consistency for Large Language Model Generation	Nov 29, 2023	Code GenerationLanguage Modeling	—Unverified	0
Downstream Trade-offs of a Family of Text Watermarks	Nov 16, 2023	FormLanguage Modelling	CodeCode Available	0
Monolingual or Multilingual Instruction Tuning: Which Makes a Better Alpaca	Sep 16, 2023	Instruction FollowingLarge Language Model	CodeCode Available	0
Prompting Large Language Models with Speech Recognition Abilities	Jul 21, 2023	Abstractive Text SummarizationAutomatic Speech Recognition	—Unverified	0
PRD: Peer Rank and Discussion Improve Large Language Model based Evaluations	Jul 6, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
On the Model-Misspecification in Reinforcement Learning	Jun 19, 2023	modelOpen-Ended Question Answering	—Unverified	0
2D-Shapley: A Framework for Fragmented Data Valuation	Jun 18, 2023	counterfactualData Valuation	CodeCode Available	0
Adversaries with Limited Information in the Friedkin--Johnsen Model	Jun 17, 2023	Open-Ended Question AnsweringSociology	CodeCode Available	0
POP: Prompt Of Prompts for Continual Learning	Jun 14, 2023	Continual LearningOpen-Ended Question Answering	—Unverified	0
Mol-Instructions: A Large-Scale Biomolecular Instruction Dataset for Large Language Models	Jun 13, 2023	Catalytic activity predictionChemical-Disease Interaction Extraction	CodeCode Available	2
Provable Accelerated Convergence of Nesterov's Momentum for Deep ReLU Neural Networks	Jun 13, 2023	Open-Ended Question Answering	—Unverified	0
Non-autoregressive Conditional Diffusion Models for Time Series Prediction	Jun 8, 2023	DenoisingOpen-Ended Question Answering	—Unverified	0
Benchmarking Foundation Models with Language-Model-as-an-Examiner	Jun 7, 2023	BenchmarkingLanguage Modeling	—Unverified	0
Differences in boundary behavior in the 3D vertex and Voronoi models	Jun 6, 2023	Open-Ended Question Answering	—Unverified	0

Show:10 25 50

← PrevPage 1 of 16Next →

No leaderboard results yet.