500,000 Bilder von natürlichen Szenen in 21 Ländern & Dokumentaufnahmen & elektronische Szenen mit OCR-Anmerkungen

mehrsprachiges OCR-Datensatz

Szenentexterkennungsdaten

Dokument-OCR-Datensatz

elektronische Bildschirmanzeigendaten OCR

OCR-Datensatz in 21 Sprachen

KI-OCR-Trainingsdaten

Texterkennungsdatensatz

500,000 Bilder von 21 Ländern mit natürlichen Szenen, Dokumentenfotografie-Szenen und elektronischen Szenen für OCR-Kennzeichnung. Die Daten umfassen 21 Sprachen, wobei die Anzahl der Bilder pro Sprache zwischen 20,000 und 25,000 liegt. Die Datentypen umfassen natürliche Szenen, Dokumentenfotografie-Szenen und elektronische Szenen. Die Datenvielfalt beinhaltet verschiedene Datentypen, unterschiedliche Aufnahmewinkel und mehrere Sprachen. Für die Kennzeichnung werden Zeilen- (Spalten-) level Vier-Eck- oder Polygon-Kennzeichnungen sowie zeilen- (spalten-) level Inhaltsabschriften verwendet. Die Daten können für mehrsprachige OCR-Erkennungsaufgaben genutzt werden.

Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.

Spezifikationen

Datenumfang

500,000 Bilder, die Verteilung pro Sprache liegt zwischen 20,000 und 25,000 Bildern

Sprachverteilung

Deutsch, Französisch, Portugiesisch, Italienisch, Spanisch, Indonesisch, Russisch, Japanisch, Koreanisch, Vietnamesisch, Polnisch, Tschechisch, Türkisch, Philippinisch, Niederländisch, Hindi, Malaiisch, Kasachisch, Slowakisch, Rumänisch, Usbekisch

Erfassungsumgebung

Dokumentenfotoszenen: Bücher, Zeitungen, verschiedene Arten von Karten, Rechnungen etc.; Natürliche Szenen: Poster, Warnhinweise, Straßenschilder, Lebensmittelverpackungen, Werbetafeln, Haltestellenschilder, Ladenbeschilderung etc.; Elektronische Szenen: Handy-Screenshots, Computer-Screenshots, elektronische Dokumente

Datensammlung Vielfalt

verschiedene Datentypen, verschiedene Aufnahmewinkel, mehrsprachige Sprachen

Aufnahmegeräte

Handy, Computer

Datenformat

Bildformate wie .jpg und andere gängige Formate, Annotationsdokumente im .json-Format

Annotationsinhalt

Zeilen- (oder Spalten-)ebene Vierseiten- oder Polygon-Annotationen, Zeilen- (oder Spalten-)ebene Inhaltsübertragung

Genauigkeit

Zeilen-ebene Erkennungsrahmen-Genauigkeit mindestens 97%, Rahmen korrekt in Zeilen aufgeteilt und Abweichungen von höchstens 5 Pixeln werden als korrekte Annotation anerkannt; Zeilen- und Zeichen-ebene Transkription mindestens 97% genau.

500,000 Bilder von natürlichen Szenen in 21 Ländern & Dokumentaufnahmen & elektronische Szenen mit OCR-Anmerkungen

mehrsprachiges OCR-Datensatz Szenentexterkennungsdaten Dokument-OCR-Datensatz elektronische Bildschirmanzeigendaten OCR OCR-Datensatz in 21 Sprachen KI-OCR-Trainingsdaten Texterkennungsdatensatz

Projekt-Reifegrad

mehrsprachiges OCR-Datensatz

Szenentexterkennungsdaten

Dokument-OCR-Datensatz

elektronische Bildschirmanzeigendaten OCR

OCR-Datensatz in 21 Sprachen

KI-OCR-Trainingsdaten

Texterkennungsdatensatz