Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1175 of 1209 papers

Title	Date	Tasks	Status
TICCLops: Text-Induced Corpus Clean-up as online processing system	Aug 1, 2014	Optical Character Recognition (OCR)Spelling Correction	—Unverified
Solving Substitution Ciphers with Combined Language Models	Aug 1, 2014	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Named Entity Recognition and Correction in OCRized Corpora (D\'etection et correction automatique d'entit\'es nomm\'ees dans des corpus OCRis\'es) [in French]	Jul 1, 2014	named-entity-recognitionNamed Entity Recognition	—Unverified
Bambara and Maninka Manding Languages Written Corpora Project (``Projet des corpus \'ecrits des langues manding : le bambara, le maninka'') [in French]	Jul 1, 2014	Optical Character Recognition (OCR)	—Unverified
Offline Handwritten MODI Character Recognition Using HU, Zernike Moments and Zoning	Jun 24, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Learning Ensembles of Structured Prediction Rules	Jun 1, 2014	Machine TranslationOptical Character Recognition (OCR)	—Unverified
Unsupervised Morphology-Based Vocabulary Expansion	Jun 1, 2014	Language ModellingMachine Translation	—Unverified
Improved Typesetting Models for Historical OCR	Jun 1, 2014	Optical Character Recognition (OCR)	—Unverified
Open Philology at the University of Leipzig	May 1, 2014	Optical Character Recognition (OCR)	—Unverified
Synergy of Nederlab and	May 1, 2014	Optical Character Recognition (OCR)	—Unverified
Corpus for Coreference Resolution on Scientific Papers	May 1, 2014	coreference-resolutionCoreference Resolution	CodeCode Available
Corpus of 19th-century Czech Texts: Problems and Solutions	May 1, 2014	Optical Character Recognition (OCR)	—Unverified
Amazigh Verb Conjugator	May 1, 2014	Optical Character Recognition (OCR)	—Unverified
Construction and Annotation of a French Folkstale Corpus	May 1, 2014	Emotion RecognitionInformation Retrieval	—Unverified
FLELex: a graded lexical resource for French foreign learners	May 1, 2014	Language AcquisitionOptical Character Recognition (OCR)	—Unverified
The Interplay Between Lexical and Syntactic Resources in Incremental Parsebanking	May 1, 2014	Optical Character Recognition (OCR)	—Unverified
CorA: A web-based annotation tool for historical and other non-standard language data	Apr 1, 2014	Optical Character Recognition (OCR)	—Unverified
Bootstrapping a historical commodities lexicon with SKOS and DBpedia	Apr 1, 2014	ChunkingLanguage Identification	—Unverified
Automated Error Detection in Digitized Cultural Heritage Documents	Apr 1, 2014	Optical Character Recognition (OCR)Spelling Correction	—Unverified
CHISPA on the GO: A mobile Chinese-Spanish translation service for travellers in trouble	Apr 1, 2014	Image RetrievalInformation Retrieval	—Unverified
Extraction of Line Word Character Segments Directly from Run Length Compressed Printed Text Documents	Mar 30, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
A Novel Method for the Recognition of Isolated Handwritten Arabic Characters	Feb 26, 2014	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Bangla Text Recognition from Video Sequence: A New Focus	Jan 6, 2014	BinarizationOptical Character Recognition (OCR)	—Unverified
Generalizing Analytic Shrinkage for Arbitrary Covariance Structures	Dec 1, 2013	Optical Character RecognitionOptical Character Recognition (OCR)	—Unverified
Learning Adaptive Value of Information for Structured Prediction	Dec 1, 2013	feature selectionModel Selection	—Unverified

Show:10 25 50

← PrevPage 47 of 49Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified