Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 1209 papers

Title	Date	Tasks	Status
Books of Hours. the First Liturgical Data Set for Text Segmentation.	May 1, 2020	Handwritten Text RecognitionHTR	—Unverified
Boosting High-Level Vision with Joint Compression Artifacts Reduction and Super-Resolution	Oct 18, 2020	Face DetectionOptical Character Recognition	—Unverified
Boosting Optical Character Recognition: A Super-Resolution Approach	Jun 7, 2015	Image Super-ResolutionOptical Character Recognition	—Unverified
Bootstrapping a historical commodities lexicon with SKOS and DBpedia	Apr 1, 2014	ChunkingLanguage Identification	—Unverified
BoundingDocs: a Unified Dataset for Document Question Answering with Spatial Annotations	Jan 6, 2025	Document AIdocument understanding	—Unverified
Braille-to-Speech Generator: Audio Generation Based on Joint Fine-Tuning of CLIP and Fastspeech2	Jul 19, 2024	Audio GenerationAudio Synthesis	—Unverified
Broken News: Making Newspapers Accessible to Print-Impaired	Jun 21, 2022	Instance SegmentationOptical Character Recognition (OCR)	—Unverified
BROS: A Pre-trained Language Model for Understanding Texts in Document	Jan 1, 2021	DecoderDiversity	—Unverified
Budget-Optimal Task Allocation for Reliable Crowdsourcing Systems	Oct 17, 2011	image-classificationImage Classification	—Unverified
Building a Corpus from Handwritten Picture Postcards: Transcription, Annotation and Part-of-Speech Tagging	May 1, 2018	Optical Character Recognition (OCR)Part-Of-Speech Tagging	—Unverified
Building A Handwritten Cuneiform Character Imageset	May 1, 2018	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Building OCR/NER Test Collections	May 1, 2020	named-entity-recognitionNamed Entity Recognition	—Unverified
BusiNet -- a Light and Fast Text Detection Network for Business Documents	Jul 4, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Bypassing Captcha By Machine A Proof For Passing The Turing Test	Sep 3, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Callico: a Versatile Open-Source Document Image Annotation Platform	May 2, 2024	Document Layout AnalysisHTR	—Unverified
CalliReader: Contextualizing Chinese Calligraphy via an Embedding-Aligned Vision-Language Model	Mar 9, 2025	HallucinationLanguage Modeling	—Unverified
CAMIO: A Corpus for OCR in Multiple Languages	Jun 1, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Can Visual Language Models Replace OCR-Based Visual Question Answering Pipelines in Production? A Case Study in Retail	Aug 28, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Can You Read Me Now? Content Aware Rectification using Angle Supervision	Aug 5, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Cascaded Detail-Preserving Networks for Super-Resolution of Document Images	Nov 25, 2019	Image Super-ResolutionOptical Character Recognition (OCR)	—Unverified
Categorizing ancient documents	Aug 28, 2013	Handwriting RecognitionOptical Character Recognition (OCR)	—Unverified
CC-OCR: A Comprehensive and Challenging OCR Benchmark for Evaluating Large Multimodal Models in Literacy	Dec 3, 2024	HallucinationKey Information Extraction	—Unverified
CG-DIQA: No-reference Document Image Quality Assessment Based on Character Gradient	Jul 11, 2018	Document Image Quality AssessmentImage Quality Assessment	—Unverified
Challenging America: Modeling language in longer time scales	Dec 17, 2021	Cloze TestOptical Character Recognition (OCR)	—Unverified
Challenging America: Modeling language in longer time scales	Jul 1, 2022	Cloze TestOptical Character Recognition (OCR)	—Unverified
Character Keypoint-based Homography Estimation in Scanned Documents for Efficient Information Extraction	Nov 14, 2019	Homography EstimationOptical Character Recognition	—Unverified
Chargrid-OCR: End-to-end Trainable Optical Character Recognition for Printed Documents using Instance Segmentation	Sep 10, 2019	GPUInstance Segmentation	—Unverified
Chargrid-OCR: End-to-end trainable Optical Character Recognition through Semantic Segmentation and Object Detection	Sep 14, 2019	GPUobject-detection	—Unverified
Chart-based Reasoning: Transferring Capabilities from LLMs to VLMs	Mar 19, 2024	Chart Question AnsweringOptical Character Recognition (OCR)	—Unverified
ChartEye: A Deep Learning Framework for Chart Information Extraction	Aug 28, 2024	Chart UnderstandingClassification	—Unverified
ChartMind: A Comprehensive Benchmark for Complex Real-world Multimodal Chart Question Answering	May 29, 2025	Chart Question AnsweringChart Understanding	—Unverified
ChartParser: Automatic Chart Parsing for Print-Impaired	Nov 16, 2022	Optical Character Recognition (OCR)	—Unverified
Chart-RCNN: Efficient Line Chart Data Extraction from Camera Images	Nov 25, 2022	object-detectionObject Detection	—Unverified
ChatSchema: A pipeline of extracting structured information with Large Multimodal Models based on schema	Jul 26, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Chaurah: A Smart Raspberry Pi based Parking System	Dec 28, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
ChemRxivQuest: A Curated Chemistry Question-Answer Database Extracted from ChemRxiv Preprints	May 8, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Chinese/English mixed Character Segmentation as Semantic Segmentation	Nov 7, 2016	DiversityOptical Character Recognition (OCR)	—Unverified
CHISPA on the GO: A mobile Chinese-Spanish translation service for travellers in trouble	Apr 1, 2014	Image RetrievalInformation Retrieval	—Unverified
Chunk-based Chinese Spelling Check with Global Optimization	Nov 1, 2020	global-optimizationOptical Character Recognition	—Unverified
Classification of Contract-Amendment Relationships	Jun 8, 2021	ClassificationManagement	—Unverified
Classification of Documents Extracted from Images with Optical Character Recognition Methods	Jun 15, 2021	BIG-bench Machine LearningOptical Character Recognition	—Unverified
Classroom Slide Narration System	Jan 21, 2022	Image SegmentationOptical Character Recognition	—Unverified
Cleansing Jewel: A Neural Spelling Correction Model Built On Google OCR-ed Tibetan Manuscripts	Apr 7, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
CLIP is Almost All You Need: Towards Parameter-Efficient Scene Text Retrieval without OCR	Jan 1, 2025	AllOptical Character Recognition	—Unverified
CLIP-ReIdent: Contrastive Training for Player Re-Identification	Mar 21, 2023	Optical Character Recognition (OCR)Sports Analytics	—Unverified
Clustering-based Automatic Construction of Legal Entity Knowledge Base from Contracts	Nov 18, 2020	Clusteringnamed-entity-recognition	—Unverified
CMUQ@QALB-2014: An SMT-based System for Automatic Arabic Error Correction	Oct 1, 2014	Language ModellingMachine Translation	—Unverified
CNN based Cuneiform Sign Detection Learned from Annotated 3D Renderings and Mapped Photographs with Illumination Augmentation	Aug 22, 2023	Optical Character Recognition (OCR)	—Unverified
CodeSCAN: ScreenCast ANalysis for Video Programming Tutorials	Sep 27, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Combining Human and Machine Transcriptions on the Zooniverse Platform	Nov 1, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified

Show:10 25 50

← PrevPage 19 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified