Startseite > Alle Kategorie-Datensätze > OCR-Datensätze > 104,320 Bilder-Koreanische und Hindi OCR-Daten in natürlichen Szenarien

104,320 Bilder-Koreanische und Hindi OCR-Daten in natürlichen Szenarien

Koreanisch

Hindi

OCR-Daten

Natürliche Szene

OCR-Transliterationsdaten

104,320 OCR-Datenerfassungsszenen in natürlicher Umgebung in Koreanisch und Hindi, darunter Produktverpackungen, Plakate, Eintrittskarten, Aufforderungen, Speisekarten und Gebäudeschilder. Die Datenvielfalt umfasst mehrere Szenen, mehrere Aufnahmewinkel und mehrere Lichtverhältnisse. Die Sprachverteilung ist Koreanisch, Hindi und Englisch (einige wenige). Die Daten sind mit polygonalen Kästen auf Zeilenebene (oder viereckigen Kästen, rechteckigen Kästen), einer Transkription des Inhalts auf Zeilenebene und Textattributen (Sprachart) sowie mit polygonalen Kästen auf Spaltenebene (oder viereckigen Kästen, rechteckigen Kästen), einer Transkription des Inhalts auf Spaltenebene und Textattributen (Sprachart) versehen. Dieser Satz von OCR-Daten für koreanische und hindische Naturszenen kann für OCR-Aufgaben in koreanischen und hindischen Naturszenen verwendet werden.

Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.

Spezifikationen

Größe der Daten

Koreanisch 76,861 Blätter, 555,913 Rahmen; Hindi 27,459 Blätter, 200,453 Rahmen

Akquisitionsumgebung

Einschließlich Produktverpackungen, Plakate, Tickets, Mahnungen, Speisekarten, Gebäudeschilder usw.

Vielfalt der Sammlung

Mehrere natürliche Szenen, mehrere Aufnahmewinkel, unterschiedliche Lichtverhältnisse

Erfassungsgeräte

Handy

Aufnahmewinkel

Ansehen, Blick von oben, Blick von vorne

Verteilung der Sprachen

Koreanisch, Hindi, Englisch (wenige)

Datenformat

Bildformat: .jpg, Markierungsdateiformat: .json

Verteilung der Form von Markerboxen

Koreanisch 315,822 viereckige Boxen, 240,091 polygonale Boxen; Hindi 780 viereckige Boxen, 199,671 polygonale Boxen, 2 rechteckige Boxen

Inhalt des Markups

Beschriftung der Polygonboxen auf Zeilenebene (oder Quadboxen, Rechteckboxen), Transkription des Inhalts auf Zeilenebene, Textattribute (Sprachart); Beschriftung der Polygonboxen auf Spaltenebene (oder Quadboxen, Rechteckboxen), Transkription des Inhalts auf Spaltenebene, Textattribute (Sprachart)

Genauigkeit

Markierungsboxen mit einer Abweichung von höchstens fünf Pixeln werden korrekt erkannt, die Genauigkeit der Erkennungsboxen liegt bei mindestens 95%; die Genauigkeit der Texttranskription liegt bei mindestens 95%.

104,320 Bilder-Koreanische und Hindi OCR-Daten in natürlichen Szenarien

Koreanisch Hindi OCR-Daten Natürliche Szene OCR-Transliterationsdaten

Projekt-Reifegrad

Koreanisch

Hindi

OCR-Daten

Natürliche Szene

OCR-Transliterationsdaten