[{"@type":"PropertyValue","name":"Speicherformat","value":"TXT"},{"@type":"PropertyValue","name":"Inhalt der Daten","value":"Chinesisch-tibetisches Parallelkorpus"},{"@type":"PropertyValue","name":"Größe der Daten","value":"5,01 Millionen Datenpaare des chinesisch-tibetischen Parallelkorpus, die durchschnittliche Satzlänge des Chinesischen beträgt 20,8 Zeichen."},{"@type":"PropertyValue","name":"Sprache","value":"Chinesisch, Tibetisch"},{"@type":"PropertyValue","name":"Anwendungsszenario","value":"Maschinelle Übersetzung"}]
{"id":1236,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp","type1":"183","type1str":null,"type2":"185","type2str":null,"dataname":"5,010,000 Gruppen-Chinesisch-Tibetische Parallelkorpusdaten","datazy":[{"title":"Speicherformat","desc":"Speicherformat","content":"TXT"},{"title":"Inhalt der Daten","desc":"Inhalt der Daten","content":"Chinesisch-tibetisches Parallelkorpus"},{"title":"Größe der Daten","desc":"Größe der Daten","content":"5,01 Millionen Datenpaare des chinesisch-tibetischen Parallelkorpus, die durchschnittliche Satzlänge des Chinesischen beträgt 20,8 Zeichen."},{"title":"Sprache","desc":"Sprache","content":"Chinesisch, Tibetisch"},{"title":"Anwendungsszenario","desc":"Anwendungsszenario","content":"Maschinelle Übersetzung"}],"datatag":"Chinese,Tibetan,Chinese-Tibetan,Parallel Corpus","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230315001_demo1729159200808/demo.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230315001_demo1729159200808/demo.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=tLL0sffQZBePZWEDJDuUT0Q%2B7oI%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"Die Daten des chinesisch-tibetischen Parallelkorpus umfassen 5,01 Millionen Sätze chinesischer und tibetischer Parallelübersetzungen, die im txt-Format gespeichert sind. Die Daten wurden zur Qualitätskontrolle bereinigt und desensibilisiert und können als Basiskorpus für die Analyse von Textdaten, maschinelle Übersetzung und andere Bereiche verwendet werden.","dataexampl":null,"datakeyword":["Chinesische und tibetische parallele Korpusdaten"," Abgleichskorpus"," parallele Korpusdaten"," Abgleichskorpusdaten"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"nlu","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"5,010,000 Groups - Chinese-Tibetan Parallel Corpus Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://de.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230315001_demo1729159200808/demo.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=tLL0sffQZBePZWEDJDuUT0Q%2B7oI%3D"}]
5,010,000 Gruppen-Chinesisch-Tibetische Parallelkorpusdaten
Chinesische und tibetische parallele Korpusdaten
Abgleichskorpus
parallele Korpusdaten
Abgleichskorpusdaten
Die Daten des chinesisch-tibetischen Parallelkorpus umfassen 5,01 Millionen Sätze chinesischer und tibetischer Parallelübersetzungen, die im txt-Format gespeichert sind. Die Daten wurden zur Qualitätskontrolle bereinigt und desensibilisiert und können als Basiskorpus für die Analyse von Textdaten, maschinelle Übersetzung und andere Bereiche verwendet werden.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
![Spezifikationen]()
Spezifikationen
Inhalt der Daten
Chinesisch-tibetisches Parallelkorpus
Größe der Daten
5,01 Millionen Datenpaare des chinesisch-tibetischen Parallelkorpus, die durchschnittliche Satzlänge des Chinesischen beträgt 20,8 Zeichen.
Sprache
Chinesisch, Tibetisch
Anwendungsszenario
Maschinelle Übersetzung
![Probe]()
Probe
![Empfohlene Datensätze]()
Empfohlener Datensatz
Nennen Sie uns Ihre besonderen Bedürfnisse
ca9d53b1-2936-4d2b-a27f-82a6dd65e45d