TriviaQA

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 124 papers

Title	Date	Tasks	Status
From Artificial Needles to Real Haystacks: Improving Retrieval Capabilities in LLMs by Finetuning on Synthetic Data	Jun 27, 2024	HallucinationInformation Retrieval	CodeCode Available
Judging the Judges: Evaluating Alignment and Vulnerabilities in LLMs-as-Judges	Jun 18, 2024	TriviaQA	CodeCode Available
CrAM: Credibility-Aware Attention Modification in LLMs for Combating Misinformation in RAG	Jun 17, 2024	MisinformationRAG	CodeCode Available
RE-RAG: Improving Open-Domain QA Performance and Interpretability with Relevance Estimator in Retrieval-Augmented Generation	Jun 9, 2024	Document RankingNatural Questions	CodeCode Available
LACIE: Listener-Aware Finetuning for Confidence Calibration in Large Language Models	May 31, 2024	TriviaQATruthfulQA	CodeCode Available
Accurate and Nuanced Open-QA Evaluation Through Textual Entailment	May 26, 2024	Natural Language InferenceOpen-Domain Question Answering	CodeCode Available
KS-LLM: Knowledge Selection of Large Language Models with Evidence Document for Question Answering	Apr 24, 2024	HallucinationQuestion Answering	—Unverified
Mitigating LLM Hallucinations via Conformal Abstention	Apr 4, 2024	Conformal PredictionGenerative Question Answering	—Unverified
FIT-RAG: Black-Box RAG with Factual Information and Token Reduction	Mar 21, 2024	Open-Domain Question AnsweringQuestion Answering	—Unverified
Researchy Questions: A Dataset of Multi-Perspective, Decompositional Questions for LLM Web Agents	Feb 27, 2024	Known UnknownsQuestion Answering	—Unverified
Fine-Grained Self-Endorsement Improves Factuality and Reasoning	Feb 23, 2024	GSM8KLanguage Modeling	—Unverified
The Generative AI Paradox on Evaluation: What It Can Solve, It May Not Evaluate	Feb 9, 2024	Question AnsweringTriviaQA	—Unverified
Attendre: Wait To Attend By Retrieval With Evicted Queries in Memory-Based Transformers for Long Context Processing	Jan 10, 2024	DecoderReading Comprehension	—Unverified
Efficient Transformer Knowledge Distillation: A Performance Review	Nov 22, 2023	Knowledge DistillationModel Compression	—Unverified
Noisy Pair Corrector for Dense Retrieval	Nov 7, 2023	Code SearchRetrieval	—Unverified
A Bias-Variance-Covariance Decomposition of Kernel Scores for Generative Models	Oct 9, 2023	Image GenerationQuestion Answering	CodeCode Available
Sorted LLaMA: Unlocking the Potential of Intermediate Layers of Large Language Models for Dynamic Inference	Sep 16, 2023	Instruction FollowingQuestion Answering	—Unverified
When to Read Documents or QA History: On Unified and Selective Open-domain QA	Jun 7, 2023	Natural QuestionsOpen-Domain Question Answering	—Unverified
RFiD: Towards Rational Fusion-in-Decoder for Open-Domain Question Answering	May 26, 2023	DecoderNatural Questions	CodeCode Available
Allies: Prompting Large Language Model with Beam Search	May 24, 2023	Language ModelingLanguage Modelling	—Unverified
Just Ask for Calibration: Strategies for Eliciting Calibrated Confidence Scores from Language Models Fine-Tuned with Human Feedback	May 24, 2023	TriviaQATruthfulQA	—Unverified
CRITIC: Large Language Models Can Self-Correct with Tool-Interactive Critiquing	May 19, 2023	Fact CheckingNatural Questions	—Unverified
Quick Dense Retrievers Consume KALE: Post Training Kullback Leibler Alignment of Embeddings for Asymmetrical dual encoders	Mar 31, 2023	Knowledge DistillationLanguage Modeling	—Unverified
Dense Sparse Retrieval: Using Sparse Language Models for Inference Efficient Dense Retrieval	Mar 31, 2023	RetrievalTriviaQA	—Unverified
CLAM: Selective Clarification for Ambiguous Questions with Generative Language Models	Dec 15, 2022	Language ModellingQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 3 of 5Next →

No leaderboard results yet.