16k

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 146 papers

Title	Date	Tasks	Status
Bimanual Dexterity for Complex Tasks	Nov 20, 2024	16k	—Unverified
Piecing It All Together: Verifying Multi-Hop Multimodal Claims	Nov 14, 2024	16kAll	—Unverified
Model Editing for LLMs4Code: How Far are We?	Nov 11, 2024	16kCode Generation	CodeCode Available
Retrieval or Global Context Understanding? On Many-Shot In-Context Learning for Long-Context Evaluation	Nov 11, 2024	16kBenchmarking	CodeCode Available
Correlation-Aware Select and Merge Attention for Efficient Fine-Tuning and Context Length Extension	Oct 5, 2024	16kData Augmentation	—Unverified
Extending Context Window of Large Language Models from a Distributional Perspective	Oct 2, 2024	16k8k	CodeCode Available
Using Large Language Models for Generating Smart Contracts for Health Insurance from Textual Policies	Jul 9, 2024	16kTask 2	—Unverified
LongIns: A Challenging Long-context Instruction-based Exam for LLMs	Jun 25, 2024	16k4k	—Unverified
Inferring Pluggable Types with Machine Learning	Jun 21, 2024	16kLanguage Modeling	—Unverified
GraphReader: Building Graph-based Agent to Enhance Long-Context Abilities of Large Language Models	Jun 20, 2024	16k4k	—Unverified
Code-Switching Red-Teaming: LLM Evaluation for Safety and Multilingual Understanding	Jun 17, 2024	16kLanguage Modelling	CodeCode Available
An Empirical Study of Mamba-based Language Models	Jun 12, 2024	16kIn-Context Learning	—Unverified
Long Context Alignment with Short Instructions and Synthesized Positions	May 7, 2024	16kInstruction Following	—Unverified
FPT: Feature Prompt Tuning for Few-shot Readability Assessment	Apr 3, 2024	16kFew-Shot Text Classification	CodeCode Available
RU22Fact: Optimizing Evidence for Multilingual Explainable Fact-Checking on Russia-Ukraine Conflict	Mar 25, 2024	16kClaim Verification	CodeCode Available
An AI-Assisted Skincare Routine Recommendation System in XR	Mar 20, 2024	16k	—Unverified
Transformers for Low-Resource Languages:Is Féidir Linn!	Mar 4, 2024	16kHyperparameter Optimization	—Unverified
Human Evaluation of English--Irish Transformer-Based NMT	Mar 4, 2024	16kMachine Translation	—Unverified
Divide-Conquer-and-Merge: Memory- and Time-Efficient Holographic Displays	Feb 25, 2024	16k8k	—Unverified
Calpric: Inclusive and Fine-grain Labeling of Privacy Policies with Crowdsourcing and Active Learning	Jan 16, 2024	16kActive Learning	CodeCode Available
Detours for Navigating Instructional Videos	Jan 3, 2024	16kQuestion Answering	—Unverified
Compositional Zero-Shot Learning for Attribute-Based Object Reference in Human-Robot Interaction	Dec 21, 2023	16kAttribute	—Unverified
Beyond Accuracy: Statistical Measures and Benchmark for Evaluation of Representation from Self-Supervised Learning	Dec 2, 2023	16kDiversity	—Unverified
Improved prompting and process for writing user personas with LLMs, using qualitative interviews: Capturing behaviour and personality traits of users	Oct 10, 2023	16k	—Unverified
Retrieval meets Long Context Large Language Models	Oct 4, 2023	16k4k	—Unverified

Show:10 25 50

← PrevPage 4 of 6Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Suprime2	1'"	1	—	Unverified