[{"@type":"PropertyValue","name":"Format","value":"1) Entfernung 16-Mikrofon-Array: 48kHz, 16bit, WAV, 16 Kanäle; 2) Entfernung 8-Mikrofon-Array: 48kHz, 16bit, WAV, 8 Kanäle; 3) Entfernung High-Fidelity-Mikrofon: 48kHz, 16bit, WAV, Mono; 4) Nahbereich Handy: 16kHz, 16bit, WAV, Mono;"},{"@type":"PropertyValue","name":"Aufnahmeumgebung","value":"vier Besprechungsräume unterschiedlicher Größe, jeder Größenbereich umfasst drei verschiedene Räume"},{"@type":"PropertyValue","name":"Aufnahmeinhalt","value":"Simulation einer echten Besprechungssituation für Gesprächstraining"},{"@type":"PropertyValue","name":"Geräte","value":"16-Mikrofon-Array, 8-Mikrofon-Array, High-Fidelity-Mikrofon, Handy"},{"@type":"PropertyValue","name":"Sprache","value":"Mandarin"},{"@type":"PropertyValue","name":"Kennzeichnungsmerkmale","value":"Textannotation, Sprecheridentitätsannotation, Geschlechtsannotation, Positionsannotation"},{"@type":"PropertyValue","name":"Anwendungsbereich","value":"Spracherkennung; Stimmabdruckerkennung"},{"@type":"PropertyValue","name":"Genauigkeit","value":"Satzgenauigkeit nicht weniger als 97%"}]
{"id":1203,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"223","type2str":null,"dataname":"672-Stunden-Mehrpersonen-Konferenz mit Mehrkanal-Sprachdatenerfassung","datazy":[{"title":"Format","desc":"Format","content":"1) Entfernung 16-Mikrofon-Array: 48kHz, 16bit, WAV, 16 Kanäle; 2) Entfernung 8-Mikrofon-Array: 48kHz, 16bit, WAV, 8 Kanäle; 3) Entfernung High-Fidelity-Mikrofon: 48kHz, 16bit, WAV, Mono; 4) Nahbereich Handy: 16kHz, 16bit, WAV, Mono;"},{"title":"Aufnahmeumgebung","desc":"Aufnahmeumgebung","content":"vier Besprechungsräume unterschiedlicher Größe, jeder Größenbereich umfasst drei verschiedene Räume"},{"title":"Aufnahmeinhalt","desc":"Aufnahmeinhalt","content":"Simulation einer echten Besprechungssituation für Gesprächstraining"},{"title":"Geräte","desc":"Geräte","content":"16-Mikrofon-Array, 8-Mikrofon-Array, High-Fidelity-Mikrofon, Handy"},{"title":"Sprache","desc":"Sprache","content":"Mandarin"},{"title":"Kennzeichnungsmerkmale","desc":"Kennzeichnungsmerkmale","content":"Textannotation, Sprecheridentitätsannotation, Geschlechtsannotation, Positionsannotation"},{"title":"Anwendungsbereich","desc":"Anwendungsbereich","content":"Spracherkennung; Stimmabdruckerkennung"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"Satzgenauigkeit nicht weniger als 97%"}],"datatag":"","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"672 Stunden Mehrpersonen-Meetings wurden mit Mehrkanalaufnahmen von Sprachdaten erfasst. Die Inhalte decken Konferenzen mit 3–6 Teilnehmern ab und wurden in verschiedenen Besprechungsräumen gesammelt, wodurch reale Interaktionssituationen in Meetings widerspiegelt werden. Dieser Datensatz enthält Annotationen zu Textinhalten, Sprecheridentität, Geschlecht und Position sowie weitere Eigenschaften, mit hoher Genauigkeit (Satzgenauigkeit ≥97%) und hoher Benutzerfreundlichkeit. Er bietet hochwertige Ressourcen für die Forschung und Anwendung in der Sprach- und Stimmabdruckerkennung und wurde von mehreren KI-Unternehmen validiert: Er hilft, die Robustheit von Modellen in komplexen Meeting-Szenarien zu verbessern. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um sicherzustellen, dass die Privatsphäre und rechtlichen Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung gewahrt bleiben; alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.","dataexampl":null,"datakeyword":["Besprechung"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"672 Hours of Multi-party Conference Multi-channel Recorded Speech Data","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
672-Stunden-Mehrpersonen-Konferenz mit Mehrkanal-Sprachdatenerfassung
Besprechung
672 Stunden Mehrpersonen-Meetings wurden mit Mehrkanalaufnahmen von Sprachdaten erfasst. Die Inhalte decken Konferenzen mit 3–6 Teilnehmern ab und wurden in verschiedenen Besprechungsräumen gesammelt, wodurch reale Interaktionssituationen in Meetings widerspiegelt werden. Dieser Datensatz enthält Annotationen zu Textinhalten, Sprecheridentität, Geschlecht und Position sowie weitere Eigenschaften, mit hoher Genauigkeit (Satzgenauigkeit ≥97%) und hoher Benutzerfreundlichkeit. Er bietet hochwertige Ressourcen für die Forschung und Anwendung in der Sprach- und Stimmabdruckerkennung und wurde von mehreren KI-Unternehmen validiert: Er hilft, die Robustheit von Modellen in komplexen Meeting-Szenarien zu verbessern. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um sicherzustellen, dass die Privatsphäre und rechtlichen Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung gewahrt bleiben; alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.