[{"@type":"PropertyValue","name":"Formatierung","value":"48kHz, 16bit, unkomprimierte WAV, Mono"},{"@type":"PropertyValue","name":"Klassifizierung des Inhalts","value":"Der Rekorder wählt aus einer spezifischen Themenliste mehrere bekannte Themen aus und nimmt für jedes davon einen fließenden und natürlichen Dialog auf."},{"@type":"PropertyValue","name":"Bedingungen für die Aufzeichnung","value":"Relativ ruhiger Innenraum, kein Echo"},{"@type":"PropertyValue","name":"Erfassungsgeräte","value":"Mikrofon"},{"@type":"PropertyValue","name":"Informationen zum Schreiber","value":"Insgesamt 326 Teilnehmer, davon 120 Männer und 206 Frauen;"},{"@type":"PropertyValue","name":"Land","value":"China"},{"@type":"PropertyValue","name":"Sprachgebiet Code","value":"ug-CN"},{"@type":"PropertyValue","name":"Sprache","value":"Uyghurisch"},{"@type":"PropertyValue","name":"Kennzeichnungsmerkmale","value":"Textinhalt-Annotation, Satz-Zeitstempel, Sprecher-Kennzeichnung, Geschlecht, Rauschenssymbol-Annotation"},{"@type":"PropertyValue","name":"Genauigkeit","value":"98% Wortgenauigkeit"}]
{"id":1261,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"157 Stunden-Uigurischer Spontandialog Sprachdatensatz (Mikrofon)","datazy":[{"title":"Formatierung","desc":"Formatierung","content":"48kHz, 16bit, unkomprimierte WAV, Mono"},{"title":"Klassifizierung des Inhalts","desc":"Klassifizierung des Inhalts","content":"Der Rekorder wählt aus einer spezifischen Themenliste mehrere bekannte Themen aus und nimmt für jedes davon einen fließenden und natürlichen Dialog auf."},{"title":"Bedingungen für die Aufzeichnung","desc":"Bedingungen für die Aufzeichnung","content":"Relativ ruhiger Innenraum, kein Echo"},{"title":"Erfassungsgeräte","desc":"Erfassungsgeräte","content":"Mikrofon"},{"title":"Informationen zum Schreiber","desc":"Informationen zum Schreiber","content":"Insgesamt 326 Teilnehmer, davon 120 Männer und 206 Frauen;"},{"title":"Land","desc":"Land","content":"China"},{"title":"Sprachgebiet Code","desc":"Sprachgebiet Code","content":"ug-CN"},{"title":"Sprache","desc":"Sprache","content":"Uyghurisch"},{"title":"Kennzeichnungsmerkmale","desc":"Kennzeichnungsmerkmale","content":"Textinhalt-Annotation, Satz-Zeitstempel, Sprecher-Kennzeichnung, Geschlecht, Rauschenssymbol-Annotation"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"98% Wortgenauigkeit"}],"datatag":"Uyghur,Conversational,Microphone","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230520001_demo1721901601777/APY230520001_demo/tra_G0034_48k-8.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230520001_demo1721901601777/APY230520001_demo/tra_G0034_48k-8.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=RzSDBZ2axUpzBhFq9d19QCmr5D8%3D","intro":"ھە ياخشى ئاداش،كۆرۈشمىگىلى ئۇزۇن بوپتۇ ھە","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230520001_demo1721901601777/APY230520001_demo/tra_G0034_48k-10.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230520001_demo1721901601777/APY230520001_demo/tra_G0034_48k-10.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=R0Zkf65DFAymMaTcrhxivNmiQbQ%3D","intro":"ھە ياخشى ئۇكام ياخشى.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230520001_demo1721901601777/APY230520001_demo/tra_G0034_48k-5.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230520001_demo1721901601777/APY230520001_demo/tra_G0034_48k-5.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=wkBUOJkmgC7ZZ67p4YboYKJA9Ck%3D","intro":"ھە بولىدۇ بولىدۇ،بەش مىنۇتتىن كېيىن كۆرۈشەيلى ,ئەمىسە مەن ماشىنىنى ئېلىپ باراي","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230520001_demo1721901601777/APY230520001_demo/tra_G0034_48k-4.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230520001_demo1721901601777/APY230520001_demo/tra_G0034_48k-4.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=fncjZsOmQu5ZdF3wV7b1fPb8ZS0%3D","intro":"ھە بولىدۇ بولىدۇ،سېنىڭ دېگىنىڭمۇ توغرا ھە[S]،ئۇ ماشىنىنى ئېلىۋالساق ئىككىمىزنىڭ ئۆيىدىكىسى ھەم ئىككىمىز پاتىمىز [S]ھە بولىدۇ.","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230520001_demo1721901601777/APY230520001_demo/tra_G0034_48k-2.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230520001_demo1721901601777/APY230520001_demo/tra_G0034_48k-2.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=903jqDANRwEJqmp1S7ZVgdy0Pp8%3D","intro":"ھە ئاداش،ھېل-ھېلىقى","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Uigurische Sprachdaten_Dialog (Mikrofon), basierend auf etwa dreißig allgemeinen Themen, um die Aufnahme zu simulieren. Dieser Datensatz ist mit verschiedenen Attributen wie Textinhalt, Zeitstempel des Satzes, Identität des Sprechers, Geschlecht usw. versehen. Er wurde von 326 Uiguren mit unterschiedlichem geografischem und kulturellem Hintergrund mit hoher Genauigkeit aufgezeichnet und stellt eine reichhaltige Ressource für Forschung und Anwendungen im Bereich der Spracherkennung dar, die von mehreren KI-Unternehmen verifiziert wurde: Sie hilft dem Modell, angesichts der Vielfalt in der realen Welt gut abzuschneiden. Wir halten uns streng an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die gesetzlichen Rechte der Nutzer bei der Datenerfassung, -speicherung und -verwendung gewahrt bleiben, und zwar in Übereinstimmung mit GDPR, CCPA und PIPL.","dataexampl":null,"datakeyword":["Uigurisch"," Uigurisch"," Uigurisch"," natürlicher Dialog"," natürliche Dialogsprachdaten"," natürliche Dialogdaten"," Dialogdatensatz"," Dialogdaten"," Konversationssprache"," KI-Konversationsdaten"," natürliche Dialogsprachdaten"," KI-Konversationssprachdaten"," KI-Natursprachdialoge"," fremdsprachliche Naturdialogdaten"," Telefonate"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Data Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"157 Hours - Uyghur Conversational Speech Data by Microphone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Uigurische Sprachdaten_Dialog (Mikrofon), basierend auf etwa dreißig allgemeinen Themen, um die Aufnahme zu simulieren. Dieser Datensatz ist mit verschiedenen Attributen wie Textinhalt, Zeitstempel des Satzes, Identität des Sprechers, Geschlecht usw. versehen. Er wurde von 326 Uiguren mit unterschiedlichem geografischem und kulturellem Hintergrund mit hoher Genauigkeit aufgezeichnet und stellt eine reichhaltige Ressource für Forschung und Anwendungen im Bereich der Spracherkennung dar, die von mehreren KI-Unternehmen verifiziert wurde: Sie hilft dem Modell, angesichts der Vielfalt in der realen Welt gut abzuschneiden. Wir halten uns streng an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die gesetzlichen Rechte der Nutzer bei der Datenerfassung, -speicherung und -verwendung gewahrt bleiben, und zwar in Übereinstimmung mit GDPR, CCPA und PIPL.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Formatierung
48kHz, 16bit, unkomprimierte WAV, Mono
Klassifizierung des Inhalts
Der Rekorder wählt aus einer spezifischen Themenliste mehrere bekannte Themen aus und nimmt für jedes davon einen fließenden und natürlichen Dialog auf.
Bedingungen für die Aufzeichnung
Relativ ruhiger Innenraum, kein Echo
Erfassungsgeräte
Mikrofon
Informationen zum Schreiber
Insgesamt 326 Teilnehmer, davon 120 Männer und 206 Frauen;