[{"@type":"PropertyValue","name":"Größe der Daten","value":"30,000 Blätter, davon 10,000 Blatt in Khmer (Kambodscha), 10,000 Blatt in Laotisch und 10,000 Blatt in Myanmar."},{"@type":"PropertyValue","name":"Akquisitionsumgebung","value":"Slogans, Eintrittskarten, Plakate, Warnhinweise, Straßenschilder, Lebensmittelverpackungen, Werbetafeln, Stoppschilder und Hinweisschilder usw."},{"@type":"PropertyValue","name":"Vielfalt der Sammlung","value":"Mehrere natürliche Szenen, mehrere Aufnahmewinkel"},{"@type":"PropertyValue","name":"Erfassungsgeräte","value":"Handy"},{"@type":"PropertyValue","name":"Aufnahmewinkel","value":"Ansehen, Blick von oben, Blick von vorne"},{"@type":"PropertyValue","name":"Datenformat","value":"Bildformat: .jpg und andere gängige Formate, Markierungsdateiformat: .json"},{"@type":"PropertyValue","name":"Inhalt des Markups","value":"Viereckige Annotation auf Zeilen- (Spalten-) Ebene, Transkription des Inhalts auf Zeilen- (Spalten-) Ebene; polygonale Annotation, Transkription des Inhalts"},{"@type":"PropertyValue","name":"Genauigkeit","value":"Viereckige Box oder Polygon-Box Scheitelpunkt Abweichung von nicht mehr als fünf Pixel korrekt erkannt wird, die Erkennung der Box Genauigkeit von nicht weniger als 95%; Text Transkription Genauigkeit von nicht weniger als 95%"}]
{"id":1758,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"30,000 Bilder-Naturszenen OCR-Daten in südostasiatischen Sprachen","datazy":[{"title":"Größe der Daten","desc":"Größe der Daten","content":"30,000 Blätter, davon 10,000 Blatt in Khmer (Kambodscha), 10,000 Blatt in Laotisch und 10,000 Blatt in Myanmar."},{"title":"Akquisitionsumgebung","desc":"Akquisitionsumgebung","content":"Slogans, Eintrittskarten, Plakate, Warnhinweise, Straßenschilder, Lebensmittelverpackungen, Werbetafeln, Stoppschilder und Hinweisschilder usw."},{"title":"Vielfalt der Sammlung","desc":"Vielfalt der Sammlung","content":"Mehrere natürliche Szenen, mehrere Aufnahmewinkel"},{"title":"Erfassungsgeräte","desc":"Erfassungsgeräte","content":"Handy"},{"title":"Aufnahmewinkel","desc":"Aufnahmewinkel","content":"Ansehen, Blick von oben, Blick von vorne"},{"title":"Datenformat","desc":"Datenformat","content":"Bildformat: .jpg und andere gängige Formate, Markierungsdateiformat: .json"},{"title":"Inhalt des Markups","desc":"Inhalt des Markups","content":"Viereckige Annotation auf Zeilen- (Spalten-) Ebene, Transkription des Inhalts auf Zeilen- (Spalten-) Ebene; polygonale Annotation, Transkription des Inhalts"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"Viereckige Box oder Polygon-Box Scheitelpunkt Abweichung von nicht mehr als fünf Pixel korrekt erkannt wird, die Erkennung der Box Genauigkeit von nicht weniger als 95%; Text Transkription Genauigkeit von nicht weniger als 95%"}],"datatag":"OCR,Southeast Asian Languages,Natural Scenes,Document Photograph,Electronic Scenes","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"000403_Khmer.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20251203171931/000403_Khmer.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=L2J7muvDBy0QPwH2rM1u6k6w5JM%3D","intro":"","size":227016,"progress":100,"type":"jpg"},{"name":"002617_Khmer.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20251203171931/002617_Khmer.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=ROYTGM4k6aYF0orFqlmCCSxQMx8%3D","intro":"","size":9170388,"progress":100,"type":"jpg"},{"name":"016759_Burmese.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20251203171931/016759_Burmese.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=XBOxiiJt6plkUNjHNn3x3FcjZ1k%3D","intro":"","size":1105131,"progress":100,"type":"jpg"}],"officialSummary":"30,000 OCR-Daten von Naturszenen in kleinen südostasiatischen Sprachen, darunter Khmer (Kambodschanisch), Laotisch und Birmanisch in 3 Sprachen. Die Vielfalt der Sammlung umfasst mehrere Naturszenen und mehrere Aufnahmewinkel. Dieser Datensatz kann für OCR-Aufgaben in südostasiatischen Sprachen verwendet werden.","dataexampl":null,"datakeyword":["OCR"," Südostasiatische Sprachen"," Naturszenen"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"29,954 Images - OCR Collection Data in Southeast Asian Languages","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"030294_Laos.png","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20251203171931/030294_Laos.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=eJt2N7fokJRVZfF9OWTx3%2BOWy0A%3D","intro":"","size":8952795,"progress":100,"type":"jpg"}]}
30,000 Bilder-Naturszenen OCR-Daten in südostasiatischen Sprachen
OCR
Südostasiatische Sprachen
Naturszenen
30,000 OCR-Daten von Naturszenen in kleinen südostasiatischen Sprachen, darunter Khmer (Kambodschanisch), Laotisch und Birmanisch in 3 Sprachen. Die Vielfalt der Sammlung umfasst mehrere Naturszenen und mehrere Aufnahmewinkel. Dieser Datensatz kann für OCR-Aufgaben in südostasiatischen Sprachen verwendet werden.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Größe der Daten
30,000 Blätter, davon 10,000 Blatt in Khmer (Kambodscha), 10,000 Blatt in Laotisch und 10,000 Blatt in Myanmar.
Bildformat: .jpg und andere gängige Formate, Markierungsdateiformat: .json
Inhalt des Markups
Viereckige Annotation auf Zeilen- (Spalten-) Ebene, Transkription des Inhalts auf Zeilen- (Spalten-) Ebene; polygonale Annotation, Transkription des Inhalts
Genauigkeit
Viereckige Box oder Polygon-Box Scheitelpunkt Abweichung von nicht mehr als fünf Pixel korrekt erkannt wird, die Erkennung der Box Genauigkeit von nicht weniger als 95%; Text Transkription Genauigkeit von nicht weniger als 95%