[{"@type":"PropertyValue","name":"Größe der Daten","value":"Koreanisch 76,861 Blätter, 555,913 Rahmen; Hindi 27,459 Blätter, 200,453 Rahmen"},{"@type":"PropertyValue","name":"Akquisitionsumgebung","value":"Einschließlich Produktverpackungen, Plakate, Tickets, Mahnungen, Speisekarten, Gebäudeschilder usw."},{"@type":"PropertyValue","name":"Vielfalt der Sammlung","value":"Mehrere natürliche Szenen, mehrere Aufnahmewinkel, unterschiedliche Lichtverhältnisse"},{"@type":"PropertyValue","name":"Erfassungsgeräte","value":"Handy"},{"@type":"PropertyValue","name":"Aufnahmewinkel","value":"Ansehen, Blick von oben, Blick von vorne"},{"@type":"PropertyValue","name":"Verteilung der Sprachen","value":"Koreanisch, Hindi, Englisch (wenige)"},{"@type":"PropertyValue","name":"Datenformat","value":"Bildformat: .jpg, Markierungsdateiformat: .json"},{"@type":"PropertyValue","name":"Verteilung der Form von Markerboxen","value":"Koreanisch 315,822 viereckige Boxen, 240,091 polygonale Boxen; Hindi 780 viereckige Boxen, 199,671 polygonale Boxen, 2 rechteckige Boxen"},{"@type":"PropertyValue","name":"Inhalt des Markups","value":"Beschriftung der Polygonboxen auf Zeilenebene (oder Quadboxen, Rechteckboxen), Transkription des Inhalts auf Zeilenebene, Textattribute (Sprachart); Beschriftung der Polygonboxen auf Spaltenebene (oder Quadboxen, Rechteckboxen), Transkription des Inhalts auf Spaltenebene, Textattribute (Sprachart)"},{"@type":"PropertyValue","name":"Genauigkeit","value":"Markierungsboxen mit einer Abweichung von höchstens fünf Pixeln werden korrekt erkannt, die Genauigkeit der Erkennungsboxen liegt bei mindestens 95%; die Genauigkeit der Texttranskription liegt bei mindestens 95%."}]
{"id":1254,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"104,320 Bilder-Koreanische und Hindi OCR-Daten in natürlichen Szenarien","datazy":[{"title":"Größe der Daten","desc":"Größe der Daten","content":"Koreanisch 76,861 Blätter, 555,913 Rahmen; Hindi 27,459 Blätter, 200,453 Rahmen"},{"title":"Akquisitionsumgebung","desc":"Akquisitionsumgebung","content":"Einschließlich Produktverpackungen, Plakate, Tickets, Mahnungen, Speisekarten, Gebäudeschilder usw."},{"title":"Vielfalt der Sammlung","desc":"Vielfalt der Sammlung","content":"Mehrere natürliche Szenen, mehrere Aufnahmewinkel, unterschiedliche Lichtverhältnisse"},{"title":"Erfassungsgeräte","desc":"Erfassungsgeräte","content":"Handy"},{"title":"Aufnahmewinkel","desc":"Aufnahmewinkel","content":"Ansehen, Blick von oben, Blick von vorne"},{"title":"Verteilung der Sprachen","desc":"Verteilung der Sprachen","content":"Koreanisch, Hindi, Englisch (wenige)"},{"title":"Datenformat","desc":"Datenformat","content":"Bildformat: .jpg, Markierungsdateiformat: .json"},{"title":"Verteilung der Form von Markerboxen","desc":"Verteilung der Form von Markerboxen","content":"Koreanisch 315,822 viereckige Boxen, 240,091 polygonale Boxen; Hindi 780 viereckige Boxen, 199,671 polygonale Boxen, 2 rechteckige Boxen"},{"title":"Inhalt des Markups","desc":"Inhalt des Markups","content":"Beschriftung der Polygonboxen auf Zeilenebene (oder Quadboxen, Rechteckboxen), Transkription des Inhalts auf Zeilenebene, Textattribute (Sprachart); Beschriftung der Polygonboxen auf Spaltenebene (oder Quadboxen, Rechteckboxen), Transkription des Inhalts auf Spaltenebene, Textattribute (Sprachart)"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"Markierungsboxen mit einer Abweichung von höchstens fünf Pixeln werden korrekt erkannt, die Genauigkeit der Erkennungsboxen liegt bei mindestens 95%; die Genauigkeit der Texttranskription liegt bei mindestens 95%."}],"datatag":"Multiple natural scenes,Multiple shooting angles,Multiple light conditions","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/2.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/2.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1xXx3CKukYZpXUoWeGQa3UM5%2F5A%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/3.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/3.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=k36XqpwImWbppq62S04QPeMPSEA%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/1.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/1.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=zyhyQSDYy6jTbpF3nc4f%2F09ufT4%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"104,320 OCR-Datenerfassungsszenen in natürlicher Umgebung in Koreanisch und Hindi, darunter Produktverpackungen, Plakate, Eintrittskarten, Aufforderungen, Speisekarten und Gebäudeschilder. Die Datenvielfalt umfasst mehrere Szenen, mehrere Aufnahmewinkel und mehrere Lichtverhältnisse. Die Sprachverteilung ist Koreanisch, Hindi und Englisch (einige wenige). Die Daten sind mit polygonalen Kästen auf Zeilenebene (oder viereckigen Kästen, rechteckigen Kästen), einer Transkription des Inhalts auf Zeilenebene und Textattributen (Sprachart) sowie mit polygonalen Kästen auf Spaltenebene (oder viereckigen Kästen, rechteckigen Kästen), einer Transkription des Inhalts auf Spaltenebene und Textattributen (Sprachart) versehen. Dieser Satz von OCR-Daten für koreanische und hindische Naturszenen kann für OCR-Aufgaben in koreanischen und hindischen Naturszenen verwendet werden.","dataexampl":null,"datakeyword":["Koreanisch"," Hindi"," OCR-Daten"," Natürliche Szene"," OCR-Transliterationsdaten"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"104,320 Images - Korean and Hindi OCR Data in Natural Scenes","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/5.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/5.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=59499xW%2FRbwxe18fQPgO5cjSQFE%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
104,320 Bilder-Koreanische und Hindi OCR-Daten in natürlichen Szenarien
Koreanisch
Hindi
OCR-Daten
Natürliche Szene
OCR-Transliterationsdaten
104,320 OCR-Datenerfassungsszenen in natürlicher Umgebung in Koreanisch und Hindi, darunter Produktverpackungen, Plakate, Eintrittskarten, Aufforderungen, Speisekarten und Gebäudeschilder. Die Datenvielfalt umfasst mehrere Szenen, mehrere Aufnahmewinkel und mehrere Lichtverhältnisse. Die Sprachverteilung ist Koreanisch, Hindi und Englisch (einige wenige). Die Daten sind mit polygonalen Kästen auf Zeilenebene (oder viereckigen Kästen, rechteckigen Kästen), einer Transkription des Inhalts auf Zeilenebene und Textattributen (Sprachart) sowie mit polygonalen Kästen auf Spaltenebene (oder viereckigen Kästen, rechteckigen Kästen), einer Transkription des Inhalts auf Spaltenebene und Textattributen (Sprachart) versehen. Dieser Satz von OCR-Daten für koreanische und hindische Naturszenen kann für OCR-Aufgaben in koreanischen und hindischen Naturszenen verwendet werden.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Größe der Daten
Koreanisch 76,861 Blätter, 555,913 Rahmen; Hindi 27,459 Blätter, 200,453 Rahmen
Beschriftung der Polygonboxen auf Zeilenebene (oder Quadboxen, Rechteckboxen), Transkription des Inhalts auf Zeilenebene, Textattribute (Sprachart); Beschriftung der Polygonboxen auf Spaltenebene (oder Quadboxen, Rechteckboxen), Transkription des Inhalts auf Spaltenebene, Textattribute (Sprachart)
Genauigkeit
Markierungsboxen mit einer Abweichung von höchstens fünf Pixeln werden korrekt erkannt, die Genauigkeit der Erkennungsboxen liegt bei mindestens 95%; die Genauigkeit der Texttranskription liegt bei mindestens 95%.