[{"@type":"PropertyValue","name":"Datenumfang","value":"500,000 Bilder, die Verteilung pro Sprache liegt zwischen 20,000 und 25,000 Bildern"},{"@type":"PropertyValue","name":"Sprachverteilung","value":"Deutsch, Französisch, Portugiesisch, Italienisch, Spanisch, Indonesisch, Russisch, Japanisch, Koreanisch, Vietnamesisch, Polnisch, Tschechisch, Türkisch, Philippinisch, Niederländisch, Hindi, Malaiisch, Kasachisch, Slowakisch, Rumänisch, Usbekisch"},{"@type":"PropertyValue","name":"Erfassungsumgebung","value":"Dokumentenfotoszenen: Bücher, Zeitungen, verschiedene Arten von Karten, Rechnungen etc.; Natürliche Szenen: Poster, Warnhinweise, Straßenschilder, Lebensmittelverpackungen, Werbetafeln, Haltestellenschilder, Ladenbeschilderung etc.; Elektronische Szenen: Handy-Screenshots, Computer-Screenshots, elektronische Dokumente"},{"@type":"PropertyValue","name":"Datensammlung Vielfalt","value":"verschiedene Datentypen, verschiedene Aufnahmewinkel, mehrsprachige Sprachen"},{"@type":"PropertyValue","name":"Aufnahmegeräte","value":"Handy, Computer"},{"@type":"PropertyValue","name":"Datenformat","value":"Bildformate wie .jpg und andere gängige Formate, Annotationsdokumente im .json-Format"},{"@type":"PropertyValue","name":"Annotationsinhalt","value":"Zeilen- (oder Spalten-)ebene Vierseiten- oder Polygon-Annotationen, Zeilen- (oder Spalten-)ebene Inhaltsübertragung"},{"@type":"PropertyValue","name":"Genauigkeit","value":"Zeilen-ebene Erkennungsrahmen-Genauigkeit mindestens 97%, Rahmen korrekt in Zeilen aufgeteilt und Abweichungen von höchstens 5 Pixeln werden als korrekte Annotation anerkannt; Zeilen- und Zeichen-ebene Transkription mindestens 97% genau."}]
{"id":1862,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"500,000 Bilder von natürlichen Szenen in 21 Ländern & Dokumentaufnahmen & elektronische Szenen mit OCR-Anmerkungen","datazy":[{"title":"Datenumfang","desc":"Datenumfang","content":"500,000 Bilder, die Verteilung pro Sprache liegt zwischen 20,000 und 25,000 Bildern"},{"title":"Sprachverteilung","desc":"Sprachverteilung","content":"Deutsch, Französisch, Portugiesisch, Italienisch, Spanisch, Indonesisch, Russisch, Japanisch, Koreanisch, Vietnamesisch, Polnisch, Tschechisch, Türkisch, Philippinisch, Niederländisch, Hindi, Malaiisch, Kasachisch, Slowakisch, Rumänisch, Usbekisch"},{"title":"Erfassungsumgebung","desc":"Erfassungsumgebung","content":"Dokumentenfotoszenen: Bücher, Zeitungen, verschiedene Arten von Karten, Rechnungen etc.; Natürliche Szenen: Poster, Warnhinweise, Straßenschilder, Lebensmittelverpackungen, Werbetafeln, Haltestellenschilder, Ladenbeschilderung etc.; Elektronische Szenen: Handy-Screenshots, Computer-Screenshots, elektronische Dokumente"},{"title":"Datensammlung Vielfalt","desc":"Datensammlung Vielfalt","content":"verschiedene Datentypen, verschiedene Aufnahmewinkel, mehrsprachige Sprachen"},{"title":"Aufnahmegeräte","desc":"Aufnahmegeräte","content":"Handy, Computer"},{"title":"Datenformat","desc":"Datenformat","content":"Bildformate wie .jpg und andere gängige Formate, Annotationsdokumente im .json-Format"},{"title":"Annotationsinhalt","desc":"Annotationsinhalt","content":"Zeilen- (oder Spalten-)ebene Vierseiten- oder Polygon-Annotationen, Zeilen- (oder Spalten-)ebene Inhaltsübertragung"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"Zeilen-ebene Erkennungsrahmen-Genauigkeit mindestens 97%, Rahmen korrekt in Zeilen aufgeteilt und Abweichungen von höchstens 5 Pixeln werden als korrekte Annotation anerkannt; Zeilen- und Zeichen-ebene Transkription mindestens 97% genau."}],"datatag":"OCR,21 countries,Natural Scenes,Document Photograph Scenes,Electronic Scenes","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"500,000 Bilder von 21 Ländern mit natürlichen Szenen, Dokumentenfotografie-Szenen und elektronischen Szenen für OCR-Kennzeichnung. Die Daten umfassen 21 Sprachen, wobei die Anzahl der Bilder pro Sprache zwischen 20,000 und 25,000 liegt. Die Datentypen umfassen natürliche Szenen, Dokumentenfotografie-Szenen und elektronische Szenen. Die Datenvielfalt beinhaltet verschiedene Datentypen, unterschiedliche Aufnahmewinkel und mehrere Sprachen. Für die Kennzeichnung werden Zeilen- (Spalten-) level Vier-Eck- oder Polygon-Kennzeichnungen sowie zeilen- (spalten-) level Inhaltsabschriften verwendet. Die Daten können für mehrsprachige OCR-Erkennungsaufgaben genutzt werden.","dataexampl":null,"datakeyword":["mehrsprachiges OCR-Datensatz"," Szenentexterkennungsdaten"," Dokument-OCR-Datensatz"," elektronische Bildschirmanzeigendaten OCR"," OCR-Datensatz in 21 Sprachen"," KI-OCR-Trainingsdaten"," Texterkennungsdatensatz"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,DE\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"500,000 Images - Natural Scenes & Document Photograph Scenes & Electronic Scenes OCR Data of 21 Countries","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
500,000 Bilder von natürlichen Szenen in 21 Ländern & Dokumentaufnahmen & elektronische Szenen mit OCR-Anmerkungen
mehrsprachiges OCR-Datensatz
Szenentexterkennungsdaten
Dokument-OCR-Datensatz
elektronische Bildschirmanzeigendaten OCR
OCR-Datensatz in 21 Sprachen
KI-OCR-Trainingsdaten
Texterkennungsdatensatz
500,000 Bilder von 21 Ländern mit natürlichen Szenen, Dokumentenfotografie-Szenen und elektronischen Szenen für OCR-Kennzeichnung. Die Daten umfassen 21 Sprachen, wobei die Anzahl der Bilder pro Sprache zwischen 20,000 und 25,000 liegt. Die Datentypen umfassen natürliche Szenen, Dokumentenfotografie-Szenen und elektronische Szenen. Die Datenvielfalt beinhaltet verschiedene Datentypen, unterschiedliche Aufnahmewinkel und mehrere Sprachen. Für die Kennzeichnung werden Zeilen- (Spalten-) level Vier-Eck- oder Polygon-Kennzeichnungen sowie zeilen- (spalten-) level Inhaltsabschriften verwendet. Die Daten können für mehrsprachige OCR-Erkennungsaufgaben genutzt werden.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Datenumfang
500,000 Bilder, die Verteilung pro Sprache liegt zwischen 20,000 und 25,000 Bildern
Dokumentenfotoszenen: Bücher, Zeitungen, verschiedene Arten von Karten, Rechnungen etc.; Natürliche Szenen: Poster, Warnhinweise, Straßenschilder, Lebensmittelverpackungen, Werbetafeln, Haltestellenschilder, Ladenbeschilderung etc.; Elektronische Szenen: Handy-Screenshots, Computer-Screenshots, elektronische Dokumente
Datensammlung Vielfalt
verschiedene Datentypen, verschiedene Aufnahmewinkel, mehrsprachige Sprachen
Aufnahmegeräte
Handy, Computer
Datenformat
Bildformate wie .jpg und andere gängige Formate, Annotationsdokumente im .json-Format
Annotationsinhalt
Zeilen- (oder Spalten-)ebene Vierseiten- oder Polygon-Annotationen, Zeilen- (oder Spalten-)ebene Inhaltsübertragung
Genauigkeit
Zeilen-ebene Erkennungsrahmen-Genauigkeit mindestens 97%, Rahmen korrekt in Zeilen aufgeteilt und Abweichungen von höchstens 5 Pixeln werden als korrekte Annotation anerkannt; Zeilen- und Zeichen-ebene Transkription mindestens 97% genau.