[{"@type":"PropertyValue","name":"Formatierung","value":"16kHz, 16bit, WAV, Mono"},{"@type":"PropertyValue","name":"Klassifizierung des Inhalts","value":"Dialogartig, Self-Media, Varieté-Artig usw."},{"@type":"PropertyValue","name":"Aufnahmeumgebung","value":"Geringer Lärm"},{"@type":"PropertyValue","name":"Land","value":"Thailand"},{"@type":"PropertyValue","name":"Sprachgebiet Code","value":"th-TH"},{"@type":"PropertyValue","name":"Sprache","value":"Thailändisch"},{"@type":"PropertyValue","name":"Kennzeichnungsmerkmale","value":"Textinhalt-Annotation, Satz-Zeitstempel, Sprecher-Kennzeichnung, Geschlecht, Rauschenssymbol-Annotation"},{"@type":"PropertyValue","name":"Genauigkeit","value":"98% Wortgenauigkeit (Beschriftungen, Geschlechtsmarkierungen, Sprecherkennungen, Akzente und Themen werden in der Genauigkeitsstatistik nicht berücksichtigt)"}]
{"id":1687,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"900 Stunden-Thai(Thailand) Real-world Casual Conversation and Monologue Sprachdatensatz","datazy":[{"title":"Formatierung","desc":"Formatierung","content":"16kHz, 16bit, WAV, Mono"},{"title":"Klassifizierung des Inhalts","desc":"Klassifizierung des Inhalts","content":"Dialogartig, Self-Media, Varieté-Artig usw."},{"title":"Aufnahmeumgebung","desc":"Aufnahmeumgebung","content":"Geringer Lärm"},{"title":"Land","desc":"Land","content":"Thailand"},{"title":"Sprachgebiet Code","desc":"Sprachgebiet Code","content":"th-TH"},{"title":"Sprache","desc":"Sprache","content":"Thailändisch"},{"title":"Kennzeichnungsmerkmale","desc":"Kennzeichnungsmerkmale","content":"Textinhalt-Annotation, Satz-Zeitstempel, Sprecher-Kennzeichnung, Geschlecht, Rauschenssymbol-Annotation"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"98% Wortgenauigkeit (Beschriftungen, Geschlechtsmarkierungen, Sprecherkennungen, Akzente und Themen werden in der Genauigkeitsstatistik nicht berücksichtigt)"}],"datatag":"Thai,Casual Conversation,ASR","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"500001_6.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500001_6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=2OvhfaFaWY3zdwE%2BIHh5Rg8oXJg%3D","intro":"คุณผู้ฟังมีความคิดแบบนี้ไหมคะ ในวันที่เราเหนื่อยมากมาก เราท้อมากมาก เราเริ่มไม่อยากจะมีชีวิตอยู่แล้ว","size":241800,"progress":100,"type":"mp3"},{"name":"500002_8.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500002_8.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=%2BXu1ouOHCx9fViVsDUxgWwASHxw%3D","intro":"อยู่ที่โคราช แล้วจะมีการซ้อมรบกันอยู่ ฝึกซ้อมรบกันอยู่น่ะ ก็ตั้งชื่อผมอะคลอดพอดี ก็ตั้งชื่อผมว่าประลองยุทธ์","size":253750,"progress":100,"type":"mp3"},{"name":"500004_4.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500004_4.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=UI2MbKqovKI%2Fx0Rl8er4Ho3658w%3D","intro":"ปรุงแต่งอยู่ในนั้น","size":45930,"progress":100,"type":"mp3"},{"name":"500004_8.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250721175406/500004_8.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=7Bd6uuRU0TtemREj9fJavah7cRI%3D","intro":"มันก็จะทำให้ใจรู้สึกปฏิเสธมากมาก เนี่ย แล้วมันก็เลยส่งผลออกมาเป็นความจำความรู้สึก","size":185224,"progress":100,"type":"mp3"}],"officialSummary":"Thailändische Sprachdaten, deren Inhalt generische Bereiche wie Konversation, Selbstdarstellung und Abwechslung abdeckt, spiegeln reale Interaktionskontexte wider. Dieser Datensatz ist mit einer Vielzahl von Attributen wie Textinhalt, Sprecheridentität, Geschlecht usw. annotiert. Er ist hochpräzise und einfach zu verwenden, was eine reichhaltige Ressource für spracherkennungsbezogene Forschung und Anwendungen darstellt und dazu beiträgt, dass das Modell angesichts der Vielfalt der realen Welt gut funktioniert. Wir halten uns strikt an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die Rechte der Nutzer bei der Datenerfassung, -speicherung und -verwendung gewahrt bleiben, und alle Daten sind mit GDPR, CCPA und PIPL konform.","dataexampl":null,"datakeyword":["Thailändisch"," Legere Konversation"," ASR"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1004 Hours - Thai(Thailand) Real-world Casual Conversation and Monologue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
900 Stunden-Thai(Thailand) Real-world Casual Conversation and Monologue Sprachdatensatz
Thailändisch
Legere Konversation
ASR
Thailändische Sprachdaten, deren Inhalt generische Bereiche wie Konversation, Selbstdarstellung und Abwechslung abdeckt, spiegeln reale Interaktionskontexte wider. Dieser Datensatz ist mit einer Vielzahl von Attributen wie Textinhalt, Sprecheridentität, Geschlecht usw. annotiert. Er ist hochpräzise und einfach zu verwenden, was eine reichhaltige Ressource für spracherkennungsbezogene Forschung und Anwendungen darstellt und dazu beiträgt, dass das Modell angesichts der Vielfalt der realen Welt gut funktioniert. Wir halten uns strikt an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die Rechte der Nutzer bei der Datenerfassung, -speicherung und -verwendung gewahrt bleiben, und alle Daten sind mit GDPR, CCPA und PIPL konform.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
98% Wortgenauigkeit (Beschriftungen, Geschlechtsmarkierungen, Sprecherkennungen, Akzente und Themen werden in der Genauigkeitsstatistik nicht berücksichtigt)