[{"@type":"PropertyValue","name":"Größe der Daten","value":"105,941 Bilder, darunter asiatische Sprachen: 9,997 Bilder auf Japanisch, 10,231 Bilder auf Koreanisch, 7,591 Bilder auf Indonesisch, 5,650 malaiische, 8,822 vietnamesische und 9,645 thailändische Fotos; europäische Sprachen: 10,015 französische, 7,213 deutsche, 8,824 italienische, 7,754 portugiesische, 10,376 russische und 9,823 spanische Fotos."},{"@type":"PropertyValue","name":"Akquisitionsumgebung","value":"Einschließlich Ladenschilder, Haltestellenschilder, Plakate, Fahrkarten, Wegweiser, Comics, Kanaldeckelbilder, Hinweise, Warnhinweise, Verpackungsbeschreibungen, Speisekarten, Gebäudeschilder usw."},{"@type":"PropertyValue","name":"Vielfalt der Sammlung","value":"Einschließlich 12 Sprachen, verschiedene natürliche Szenen, verschiedene Aufnahmewinkel (Aufwärtsblick, Abwärtsblick, Blick auf Augenhöhe)"},{"@type":"PropertyValue","name":"Erfassungsgeräte","value":"Handy, Kamera"},{"@type":"PropertyValue","name":"Bildparameter","value":"Bildformat: .jpg, Beschriftungsformat: .json"},{"@type":"PropertyValue","name":"Inhalt des Markups","value":"Zeilenbasierte Viereck-Annotation, Zeilenbasierte Viereck-Annotation"},{"@type":"PropertyValue","name":"Genauigkeit","value":"Die Abweichung der Eckpunkte des viereckigen Rahmens darf nicht mehr als fünf Pixel betragen, um als korrekte Erkennung zu gelten. Die Genauigkeit des Erkennungsrahmens darf nicht weniger als 97% betragen. Die Genauigkeit der Texterkennung darf nicht weniger als 97% betragen."}]
{"id":1064,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"105,941 Bilder Naturszenen OCR-Daten von 12 Sprachen","datazy":[{"title":"Größe der Daten","desc":"Größe der Daten","content":"105,941 Bilder, darunter asiatische Sprachen: 9,997 Bilder auf Japanisch, 10,231 Bilder auf Koreanisch, 7,591 Bilder auf Indonesisch, 5,650 malaiische, 8,822 vietnamesische und 9,645 thailändische Fotos; europäische Sprachen: 10,015 französische, 7,213 deutsche, 8,824 italienische, 7,754 portugiesische, 10,376 russische und 9,823 spanische Fotos."},{"title":"Akquisitionsumgebung","desc":"Akquisitionsumgebung","content":"Einschließlich Ladenschilder, Haltestellenschilder, Plakate, Fahrkarten, Wegweiser, Comics, Kanaldeckelbilder, Hinweise, Warnhinweise, Verpackungsbeschreibungen, Speisekarten, Gebäudeschilder usw."},{"title":"Vielfalt der Sammlung","desc":"Vielfalt der Sammlung","content":"Einschließlich 12 Sprachen, verschiedene natürliche Szenen, verschiedene Aufnahmewinkel (Aufwärtsblick, Abwärtsblick, Blick auf Augenhöhe)"},{"title":"Erfassungsgeräte","desc":"Erfassungsgeräte","content":"Handy, Kamera"},{"title":"Bildparameter","desc":"Bildparameter","content":"Bildformat: .jpg, Beschriftungsformat: .json"},{"title":"Inhalt des Markups","desc":"Inhalt des Markups","content":"Zeilenbasierte Viereck-Annotation, Zeilenbasierte Viereck-Annotation"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"Die Abweichung der Eckpunkte des viereckigen Rahmens darf nicht mehr als fünf Pixel betragen, um als korrekte Erkennung zu gelten. Die Genauigkeit des Erkennungsrahmens darf nicht weniger als 97% betragen. Die Genauigkeit der Texterkennung darf nicht weniger als 97% betragen."}],"datatag":"12 languages,Multiple photographic angles,Multiple scenes,Line-level quadrilateral bounding box annotation and transcription","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Spanish.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Spanish.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=TafXJxAg8o5Kg%2BGun3KIiEjsu%2BU%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Portuguese.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Portuguese.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=9arI65%2BOzsdy2xK7XZfBGqmQ2og%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/German.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/German.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=%2FiYq03v6ZQCDTNsEE6fB5DmAkGk%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"105,941 Bilder mit OCR-Daten aus natürlichen Szenen in 12 Sprachen, darunter 6 asiatische und 6 europäische Sprachen, aufgenommen in verschiedenen natürlichen Szenen und aus verschiedenen Blickwinkeln. Die Beschriftung umfasst rechteckige Rahmen für zeilenweisen Text und die Transkription von zeilenweisem Text. Dieser Datensatz kann für OCR-Aufgaben in mehreren Sprachen verwendet werden.","dataexampl":null,"datakeyword":["Japanisch"," Koreanisch"," Indonesisch"," Malaiisch"," Vietnamesisch"," Thailändisch"," Französisch"," Deutsch"," Italienisch"," Portugiesisch"," Russisch"," Spanisch"," OCR"," natürliche Szenen"," mehrere Aufnahmewinkel"," Beschriftung auf Linienebene mit viereckigen Begrenzungsrahmen und Transkription der Texte"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"105,941 Images Natural Scenes OCR Data of 12 Languages","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Russian.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200531001_demo1695808990408/Russian.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ieEtznzUAUiNqtvqirs%2F8uIwe8Y%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
105,941 Bilder Naturszenen OCR-Daten von 12 Sprachen
Japanisch
Koreanisch
Indonesisch
Malaiisch
Vietnamesisch
Thailändisch
Französisch
Deutsch
Italienisch
Portugiesisch
Russisch
Spanisch
OCR
natürliche Szenen
mehrere Aufnahmewinkel
Beschriftung auf Linienebene mit viereckigen Begrenzungsrahmen und Transkription der Texte
105,941 Bilder mit OCR-Daten aus natürlichen Szenen in 12 Sprachen, darunter 6 asiatische und 6 europäische Sprachen, aufgenommen in verschiedenen natürlichen Szenen und aus verschiedenen Blickwinkeln. Die Beschriftung umfasst rechteckige Rahmen für zeilenweisen Text und die Transkription von zeilenweisem Text. Dieser Datensatz kann für OCR-Aufgaben in mehreren Sprachen verwendet werden.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Größe der Daten
105,941 Bilder, darunter asiatische Sprachen: 9,997 Bilder auf Japanisch, 10,231 Bilder auf Koreanisch, 7,591 Bilder auf Indonesisch, 5,650 malaiische, 8,822 vietnamesische und 9,645 thailändische Fotos; europäische Sprachen: 10,015 französische, 7,213 deutsche, 8,824 italienische, 7,754 portugiesische, 10,376 russische und 9,823 spanische Fotos.
Die Abweichung der Eckpunkte des viereckigen Rahmens darf nicht mehr als fünf Pixel betragen, um als korrekte Erkennung zu gelten. Die Genauigkeit des Erkennungsrahmens darf nicht weniger als 97% betragen. Die Genauigkeit der Texterkennung darf nicht weniger als 97% betragen.