en

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

500,000 Bilder von natürlichen Szenen in 21 Ländern & Dokumentaufnahmen & elektronische Szenen mit OCR-Anmerkungen

mehrsprachiges OCR-Datensatz
Szenentexterkennungsdaten
Dokument-OCR-Datensatz
elektronische Bildschirmanzeigendaten OCR
OCR-Datensatz in 21 Sprachen
KI-OCR-Trainingsdaten
Texterkennungsdatensatz

500,000 Bilder von 21 Ländern mit natürlichen Szenen, Dokumentenfotografie-Szenen und elektronischen Szenen für OCR-Kennzeichnung. Die Daten umfassen 21 Sprachen, wobei die Anzahl der Bilder pro Sprache zwischen 20,000 und 25,000 liegt. Die Datentypen umfassen natürliche Szenen, Dokumentenfotografie-Szenen und elektronische Szenen. Die Datenvielfalt beinhaltet verschiedene Datentypen, unterschiedliche Aufnahmewinkel und mehrere Sprachen. Für die Kennzeichnung werden Zeilen- (Spalten-) level Vier-Eck- oder Polygon-Kennzeichnungen sowie zeilen- (spalten-) level Inhaltsabschriften verwendet. Die Daten können für mehrsprachige OCR-Erkennungsaufgaben genutzt werden.

Bezahlte Datensätze
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
SpezifikationenSpezifikationen
Datenumfang
500,000 Bilder, die Verteilung pro Sprache liegt zwischen 20,000 und 25,000 Bildern
Sprachverteilung
Deutsch, Französisch, Portugiesisch, Italienisch, Spanisch, Indonesisch, Russisch, Japanisch, Koreanisch, Vietnamesisch, Polnisch, Tschechisch, Türkisch, Philippinisch, Niederländisch, Hindi, Malaiisch, Kasachisch, Slowakisch, Rumänisch, Usbekisch
Erfassungsumgebung
Dokumentenfotoszenen: Bücher, Zeitungen, verschiedene Arten von Karten, Rechnungen etc.; Natürliche Szenen: Poster, Warnhinweise, Straßenschilder, Lebensmittelverpackungen, Werbetafeln, Haltestellenschilder, Ladenbeschilderung etc.; Elektronische Szenen: Handy-Screenshots, Computer-Screenshots, elektronische Dokumente
Datensammlung Vielfalt
verschiedene Datentypen, verschiedene Aufnahmewinkel, mehrsprachige Sprachen
Aufnahmegeräte
Handy, Computer
Datenformat
Bildformate wie .jpg und andere gängige Formate, Annotationsdokumente im .json-Format
Annotationsinhalt
Zeilen- (oder Spalten-)ebene Vierseiten- oder Polygon-Annotationen, Zeilen- (oder Spalten-)ebene Inhaltsübertragung
Genauigkeit
Zeilen-ebene Erkennungsrahmen-Genauigkeit mindestens 97%, Rahmen korrekt in Zeilen aufgeteilt und Abweichungen von höchstens 5 Pixeln werden als korrekte Annotation anerkannt; Zeilen- und Zeichen-ebene Transkription mindestens 97% genau.
Probe Probe
Empfohlene DatensätzeEmpfohlener Datensatz
Nennen Sie uns Ihre besonderen Bedürfnisse

Mit dem Absenden erkläre ich mich mit den Datenschutzbestimmungen einverstanden.

549be895-0a64-4b93-9a9f-2c6a0a91ef86

5309799f-086d-4a87-a71b-b96473437813