Referring expression generation

Generate referring expressions

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 84 papers

Title	Date	Tasks	Status	Hype	Score
MiniGPT-v2: large language model as a unified interface for vision-language multi-task learning	Oct 14, 2023	Image ClassificationImage Description	CodeCode Available	7	5
Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models	Mar 27, 2024	Image ClassificationImage Comprehension	CodeCode Available	7	5
Improved Baselines with Visual Instruction Tuning	Oct 5, 2023	Factual Inconsistency Detection in Chart CaptioningImage Classification	CodeCode Available	6	5
Visual Instruction Tuning	Apr 17, 2023	1 Image, 2*2 Stitching3D Question Answering (3D-QA)	CodeCode Available	6	5
Efficient Multimodal Learning from Data-centric Perspective	Feb 18, 2024	Image ClassificationReferring Expression Comprehension	CodeCode Available	5	5
LLaVA-Med: Training a Large Language-and-Vision Assistant for Biomedicine in One Day	Jun 1, 2023	Image ClassificationInstruction Following	CodeCode Available	4	5
MobileVLM : A Fast, Strong and Open Vision Language Assistant for Mobile Devices	Dec 28, 2023	AutoMLCPU	CodeCode Available	3	5
Elysium: Exploring Object-level Perception in Videos via MLLM	Mar 25, 2024	ObjectObject Tracking	CodeCode Available	2	5
GLaMM: Pixel Grounding Large Multimodal Model	Nov 6, 2023	Conversational Question AnsweringImage Captioning	CodeCode Available	2	5
Frontiers in Intelligent Colonoscopy	Oct 22, 2024	Image Captioning	CodeCode Available	2	5
Uni-Med: A Unified Medical Generalist Foundation Model For Multi-Task Learning Via Connector-MoE	Sep 26, 2024	image-classificationImage Classification	CodeCode Available	1	5
Multi-modal Instruction Tuned LLMs with Fine-grained Visual Perception	Mar 5, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Kosmos-2: Grounding Multimodal Large Language Models to the World	Jun 26, 2023	Image CaptioningIn-Context Learning	CodeCode Available	1	5
Modeling Context in Referring Expressions	Jul 31, 2016	Referring ExpressionReferring expression generation	CodeCode Available	1	5
Resilience through Scene Context in Visual Referring Expression Generation	Apr 18, 2024	Referring ExpressionReferring expression generation	CodeCode Available	0	5
Referring Expression Generation Using Entity Profiles	Sep 4, 2019	Referring ExpressionReferring expression generation	CodeCode Available	0	5
Pento-DIARef: A Diagnostic Dataset for Learning the Incremental Algorithm for Referring Expression Generation from Examples	May 24, 2023	DiagnosticReferring Expression	CodeCode Available	0	5
NeuralREG: An end-to-end approach to referring expression generation	May 21, 2018	FormReferring Expression	CodeCode Available	0	5
Referring Expression Generation in Visually Grounded Dialogue with Discourse-aware Comprehension Guiding	Sep 9, 2024	Image RetrievalReferring Expression	CodeCode Available	0	5
Enhancing Visual Grounding and Generalization: A Multi-Task Cycle Training Approach for Vision-Language Models	Nov 21, 2023	Image SegmentationLanguage Modelling	CodeCode Available	0	5
Enriching the WebNLG corpus	Nov 1, 2018	Machine TranslationReferring Expression	CodeCode Available	0	5
Enriching the E2E dataset	Aug 1, 2021	Referring ExpressionReferring expression generation	CodeCode Available	0	5
Collecting Visually-Grounded Dialogue with A Game Of Sorts	Sep 10, 2023	Coreference ResolutionImage Retrieval	CodeCode Available	0	5
Improving Quality and Efficiency in Plan-based Neural Data-to-Text Generation	Sep 22, 2019	Data-to-Text GenerationReferring Expression	CodeCode Available	0	5
Grounding Language in Multi-Perspective Referential Communication	Oct 4, 2024	Referring ExpressionReferring expression generation	CodeCode Available	0	5

Show:10 25 50

← PrevPage 1 of 4Next →

All datasets ColonINST-v1 (Seen)ColonINST-v1 (Unseen)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ColonGPT (w/ LoRA, w/o extra data)	Accuray	99.96	—	Unverified
2	LLaVA-v1.5 (w/ LoRA, w/ extra data)	Accuray	99.32	—	Unverified
3	LLaVA-Med-v1.5 (w/ LoRA, w/o extra data)	Accuray	99.3	—	Unverified
4	MGM-2B (w/o LoRA, w/ extra data)	Accuray	98.75	—	Unverified
5	LLaVA-v1.5 (w/ LoRA, w/o extra data)	Accuray	98.58	—	Unverified
6	MGM-2B (w/o LoRA, w/o extra data)	Accuray	98.17	—	Unverified
7	MobileVLM-1.7B (w/ LoRA, w/ extra data)	Accuray	97.87	—	Unverified
8	MobileVLM-1.7B (w/o LoRA, w/ extra data)	Accuray	97.78	—	Unverified
9	LLaVA-Med-v1.0 (w/o LoRA, w/o extra data)	Accuray	97.74	—	Unverified
10	LLaVA-Med-v1.0 (w/o LoRA, w/ extra data)	Accuray	97.35	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LLaVA-Med-v1.5 (w/ LoRA, w/ extra data)	Accuray	70	—	Unverified
2	LLaVA-v1 (w/ LoRA, w/ extra data)	Accuray	46.85	—	Unverified