[{"@type":"PropertyValue","name":"Format","value":"16kHz, 16bit, unkomprimiertes WAV, Mono"},{"@type":"PropertyValue","name":"Aufnahmeumgebung","value":"relativ ruhiger Innenraum, ohne Echo"},{"@type":"PropertyValue","name":"Aufnahmeinhalt","value":"Eine Themenliste wird bereitgestellt, der Sprecher wählt mehrere ihm vertraute Themen aus, um einen flüssigen und natürlichen Dialog zu gewährleisten, und führt zu jedem Thema ein Gespräch, das aufgezeichnet wird"},{"@type":"PropertyValue","name":"Kennzeichnungsmerkmale","value":"Annotierter Textinhalt, Start- und Endzeitpunkte gültiger Sätze, Sprecherkennung"},{"@type":"PropertyValue","name":"Geräte","value":"Android-Handy, IPhone"},{"@type":"PropertyValue","name":"Sprache","value":"Amerikanisches Englisch, Britisches Englisch, Philippinisches Englisch, Australisches Englisch, Indisches Englisch, Französisch, Deutsch, Italienisch, Japanisch, Koreanisch, Portugiesisch, Russisch, Spanisch, Thailändisch, Vietnamesisch."}]
{"id":1892,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"Interspeech 2025-MLC-SLM Mehrsprachiges Dialog-Sprachwettbewerbsdatensatz","datazy":[{"title":"Format","desc":"Format","content":"16kHz, 16bit, unkomprimiertes WAV, Mono"},{"title":"Aufnahmeumgebung","desc":"Aufnahmeumgebung","content":"relativ ruhiger Innenraum, ohne Echo"},{"title":"Aufnahmeinhalt","desc":"Aufnahmeinhalt","content":"Eine Themenliste wird bereitgestellt, der Sprecher wählt mehrere ihm vertraute Themen aus, um einen flüssigen und natürlichen Dialog zu gewährleisten, und führt zu jedem Thema ein Gespräch, das aufgezeichnet wird"},{"title":"Kennzeichnungsmerkmale","desc":"Kennzeichnungsmerkmale","content":"Annotierter Textinhalt, Start- und Endzeitpunkte gültiger Sätze, Sprecherkennung"},{"title":"Geräte","desc":"Geräte","content":"Android-Handy, IPhone"},{"title":"Sprache","desc":"Sprache","content":"Amerikanisches Englisch, Britisches Englisch, Philippinisches Englisch, Australisches Englisch, Indisches Englisch, Französisch, Deutsch, Italienisch, Japanisch, Koreanisch, Portugiesisch, Russisch, Spanisch, Thailändisch, Vietnamesisch."}],"datatag":"Challenge ,interspeech,mlc-slm,Conversational ","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"0022_001-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0022_001-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=hzFnDSJljVWVQ0tPwyC0lHgLpLY%3D","intro":"one direction is the first thing like in the mind","size":89964,"progress":100,"type":"mp3"},{"name":"0019_001_phone-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0019_001_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=brQmectqi5gBtR5JBtozW2AZlcI%3D","intro":"Parce que j'ai plus l'ancien, j'en ai que celui-là dorénavant.","size":133452,"progress":100,"type":"mp3"},{"name":"0019_001_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0019_001_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=PYIHEbEPwyvvnnaw3QcxA6RDBUI%3D","intro":"D'accord très bien l'autre, je vais l'effacer alors.","size":90220,"progress":100,"type":"mp3"},{"name":"0001_001-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0001_001-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=N9kseFImwstZ6%2BVdh6JcvzEmqz8%3D","intro":"조금 이제 날씨도 더워지는데 덜 답답하구","size":136620,"progress":100,"type":"mp3"},{"name":"0001_001-6.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250815102905/0001_001-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=9WxMMMfd0avEp9uywfxFpTf7RZ4%3D","intro":"이천치십 년이랑 이천이십일 년 진짜 학교 못 간게","size":169036,"progress":100,"type":"mp3"}],"officialSummary":"Der Hintergrund des Interspeech2025-MLC-SLM Multilingual Conversation Speech Challenge-Datensatzes ist, dass DataTang im Jahr 2025 den MLC-SLM Multilingual Conversation Speech Challenge veranstaltet hat. Der Datensatz stammt aus fünfzehn firmeneigenen Gesprächs-Sprachdatensätzen von DataTang. Die Daten sind hochpräzise, benutzerfreundlich und speziell darauf ausgelegt, die technischen Engpässe bei der mehrsprachigen Spracherkennung und dem Verständnis längerer Kontexte zu überwinden. Sie erfassen realistische komplexe Interaktionsszenarien wie Sprecherüberlagerungen und spontane Unterbrechungen und bieten reichhaltige Ressourcen für die Forschung und Anwendung im Bereich der Spracherkennung, sodass Modelle in der Lage sind, in realen, vielfältigen Szenarien hervorragende Leistungen zu zeigen. Wir halten streng die Datenschutzgesetze und -bestimmungen ein, um die Privatsphäre und die rechtlichen Interessen der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Vorschriften von GDPR, CCPA und PIPL.","dataexampl":null,"datakeyword":["Workshop-Audiodatensatz"," MLC-SLM-Datensatz"," ASR-Spracherkennungsdaten"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"INTERSPEECH 2025 MLC-SLM Challenge Dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Der Hintergrund des Interspeech2025-MLC-SLM Multilingual Conversation Speech Challenge-Datensatzes ist, dass DataTang im Jahr 2025 den MLC-SLM Multilingual Conversation Speech Challenge veranstaltet hat. Der Datensatz stammt aus fünfzehn firmeneigenen Gesprächs-Sprachdatensätzen von DataTang. Die Daten sind hochpräzise, benutzerfreundlich und speziell darauf ausgelegt, die technischen Engpässe bei der mehrsprachigen Spracherkennung und dem Verständnis längerer Kontexte zu überwinden. Sie erfassen realistische komplexe Interaktionsszenarien wie Sprecherüberlagerungen und spontane Unterbrechungen und bieten reichhaltige Ressourcen für die Forschung und Anwendung im Bereich der Spracherkennung, sodass Modelle in der Lage sind, in realen, vielfältigen Szenarien hervorragende Leistungen zu zeigen. Wir halten streng die Datenschutzgesetze und -bestimmungen ein, um die Privatsphäre und die rechtlichen Interessen der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Vorschriften von GDPR, CCPA und PIPL.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Format
16kHz, 16bit, unkomprimiertes WAV, Mono
Aufnahmeumgebung
relativ ruhiger Innenraum, ohne Echo
Aufnahmeinhalt
Eine Themenliste wird bereitgestellt, der Sprecher wählt mehrere ihm vertraute Themen aus, um einen flüssigen und natürlichen Dialog zu gewährleisten, und führt zu jedem Thema ein Gespräch, das aufgezeichnet wird
Kennzeichnungsmerkmale
Annotierter Textinhalt, Start- und Endzeitpunkte gültiger Sätze, Sprecherkennung