en

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

104,320 Bilder-Koreanische und Hindi OCR-Daten in natürlichen Szenarien

Koreanisch
Hindi
OCR-Daten
Natürliche Szene
OCR-Transliterationsdaten

104,320 OCR-Datenerfassungsszenen in natürlicher Umgebung in Koreanisch und Hindi, darunter Produktverpackungen, Plakate, Eintrittskarten, Aufforderungen, Speisekarten und Gebäudeschilder. Die Datenvielfalt umfasst mehrere Szenen, mehrere Aufnahmewinkel und mehrere Lichtverhältnisse. Die Sprachverteilung ist Koreanisch, Hindi und Englisch (einige wenige). Die Daten sind mit polygonalen Kästen auf Zeilenebene (oder viereckigen Kästen, rechteckigen Kästen), einer Transkription des Inhalts auf Zeilenebene und Textattributen (Sprachart) sowie mit polygonalen Kästen auf Spaltenebene (oder viereckigen Kästen, rechteckigen Kästen), einer Transkription des Inhalts auf Spaltenebene und Textattributen (Sprachart) versehen. Dieser Satz von OCR-Daten für koreanische und hindische Naturszenen kann für OCR-Aufgaben in koreanischen und hindischen Naturszenen verwendet werden.

Bezahlte Datensätze
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
SpezifikationenSpezifikationen
Größe der Daten
Koreanisch 76,861 Blätter, 555,913 Rahmen; Hindi 27,459 Blätter, 200,453 Rahmen
Akquisitionsumgebung
Einschließlich Produktverpackungen, Plakate, Tickets, Mahnungen, Speisekarten, Gebäudeschilder usw.
Vielfalt der Sammlung
Mehrere natürliche Szenen, mehrere Aufnahmewinkel, unterschiedliche Lichtverhältnisse
Erfassungsgeräte
Handy
Aufnahmewinkel
Ansehen, Blick von oben, Blick von vorne
Verteilung der Sprachen
Koreanisch, Hindi, Englisch (wenige)
Datenformat
Bildformat: .jpg, Markierungsdateiformat: .json
Verteilung der Form von Markerboxen
Koreanisch 315,822 viereckige Boxen, 240,091 polygonale Boxen; Hindi 780 viereckige Boxen, 199,671 polygonale Boxen, 2 rechteckige Boxen
Inhalt des Markups
Beschriftung der Polygonboxen auf Zeilenebene (oder Quadboxen, Rechteckboxen), Transkription des Inhalts auf Zeilenebene, Textattribute (Sprachart); Beschriftung der Polygonboxen auf Spaltenebene (oder Quadboxen, Rechteckboxen), Transkription des Inhalts auf Spaltenebene, Textattribute (Sprachart)
Genauigkeit
Markierungsboxen mit einer Abweichung von höchstens fünf Pixeln werden korrekt erkannt, die Genauigkeit der Erkennungsboxen liegt bei mindestens 95%; die Genauigkeit der Texttranskription liegt bei mindestens 95%.
Probe Probe
  • 104,320 Bilder-Koreanische und Hindi OCR-Daten in natürlichen Szenarien
  • 104,320 Bilder-Koreanische und Hindi OCR-Daten in natürlichen Szenarien
  • 104,320 Bilder-Koreanische und Hindi OCR-Daten in natürlichen Szenarien
Empfohlene DatensätzeEmpfohlener Datensatz
Nennen Sie uns Ihre besonderen Bedürfnisse

Mit dem Absenden erkläre ich mich mit den Datenschutzbestimmungen einverstanden.

97bf26f3-ef04-492b-98b9-c346ff983e0e

edb5c2cb-e7c3-4e61-a66e-83cc74166491