[{"@type":"PropertyValue","name":"Format","value":"Mikrofon - 48kHz, 16bit, unkomprimiertes WAV, Mono; Handy - 24kHz, 16bit, unkomprimiertes WAV, Mono"},{"@type":"PropertyValue","name":"Aufnahmeumgebung","value":"relativ ruhiger Innenraum, ohne Echo;"},{"@type":"PropertyValue","name":"Aufnahmeinhalt","value":"Es wird eine Themenliste bereitgestellt, aus der die Sprecher mehrere ihnen vertraute Themen auswählen, um einen flüssigen und natürlichen Dialog zu gewährleisten. Rund jedes Thema wird ein Dialogabschnitt aufgenommen."},{"@type":"PropertyValue","name":"Teilnehmer","value":"etwa 3,600 Sprecher, ausgewogenes Geschlechterverhältnis, Abdeckung mehrerer Altersgruppen"},{"@type":"PropertyValue","name":"Kennzeichnungsmerkmale","value":"Annotierter Textinhalt, Mandarin-Interpretation, Start- und Endzeitpunkte gültiger Sätze, Sprecherkennung"},{"@type":"PropertyValue","name":"Geräte","value":"Soundkarte + hochwertiges HiFi-Mikrofon / Smartphone"},{"@type":"PropertyValue","name":"Sprache","value":"Mandarin-Chinesisch"},{"@type":"PropertyValue","name":"Genauigkeit","value":"Zeichengenauigkeit 99%"},{"@type":"PropertyValue","name":"Anwendungsbereich","value":"Spracherkennung, Stimmabdruckerkennung"}]
{"id":1890,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"3,000 Stunden voll-duplex Mandarin natürliche Gesprächs-Sprachdaten","datazy":[{"title":"Format","desc":"Format","content":"Mikrofon - 48kHz, 16bit, unkomprimiertes WAV, Mono; Handy - 24kHz, 16bit, unkomprimiertes WAV, Mono"},{"title":"Aufnahmeumgebung","desc":"Aufnahmeumgebung","content":"relativ ruhiger Innenraum, ohne Echo;"},{"title":"Aufnahmeinhalt","desc":"Aufnahmeinhalt","content":"Es wird eine Themenliste bereitgestellt, aus der die Sprecher mehrere ihnen vertraute Themen auswählen, um einen flüssigen und natürlichen Dialog zu gewährleisten. Rund jedes Thema wird ein Dialogabschnitt aufgenommen."},{"title":"Teilnehmer","desc":"Teilnehmer","content":"etwa 3,600 Sprecher, ausgewogenes Geschlechterverhältnis, Abdeckung mehrerer Altersgruppen"},{"title":"Kennzeichnungsmerkmale","desc":"Kennzeichnungsmerkmale","content":"Annotierter Textinhalt, Mandarin-Interpretation, Start- und Endzeitpunkte gültiger Sätze, Sprecherkennung"},{"title":"Geräte","desc":"Geräte","content":"Soundkarte + hochwertiges HiFi-Mikrofon / Smartphone"},{"title":"Sprache","desc":"Sprache","content":"Mandarin-Chinesisch"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"Zeichengenauigkeit 99%"},{"title":"Anwendungsbereich","desc":"Anwendungsbereich","content":"Spracherkennung, Stimmabdruckerkennung"}],"datatag":"","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Vollduplex-Putonghua-Natural-Conversation-Sprachdaten, aufgenommen basierend auf häufigen Gesprächsthemen. Dieser Datensatz ist mit Textinhalten, Satzzeitstempel, Sprecheridentität, Geschlecht und anderen Eigenschaften annotiert und bietet eine hohe Genauigkeit. Er stellt eine wertvolle Ressource für Forschung und Anwendungen im Bereich der Spracherkennung dar und wurde von mehreren KI-Unternehmen verifiziert: Dies hilft Modellen, in der realen Welt mit ihrer Vielfalt hervorragende Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um sicherzustellen, dass die Privatsphäre und die rechtlichen Rechte der Benutzer während der Datenerfassung, -speicherung und -nutzung gewahrt bleiben. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.","dataexampl":null,"datakeyword":["Vollduplex"," Dialog"," Mandarin"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"4600 Hours - Mandarin Full-Duplex Spontaneous Dialogue Speech Dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Vollduplex-Putonghua-Natural-Conversation-Sprachdaten, aufgenommen basierend auf häufigen Gesprächsthemen. Dieser Datensatz ist mit Textinhalten, Satzzeitstempel, Sprecheridentität, Geschlecht und anderen Eigenschaften annotiert und bietet eine hohe Genauigkeit. Er stellt eine wertvolle Ressource für Forschung und Anwendungen im Bereich der Spracherkennung dar und wurde von mehreren KI-Unternehmen verifiziert: Dies hilft Modellen, in der realen Welt mit ihrer Vielfalt hervorragende Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um sicherzustellen, dass die Privatsphäre und die rechtlichen Rechte der Benutzer während der Datenerfassung, -speicherung und -nutzung gewahrt bleiben. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Es wird eine Themenliste bereitgestellt, aus der die Sprecher mehrere ihnen vertraute Themen auswählen, um einen flüssigen und natürlichen Dialog zu gewährleisten. Rund jedes Thema wird ein Dialogabschnitt aufgenommen.
Teilnehmer
etwa 3,600 Sprecher, ausgewogenes Geschlechterverhältnis, Abdeckung mehrerer Altersgruppen
Kennzeichnungsmerkmale
Annotierter Textinhalt, Mandarin-Interpretation, Start- und Endzeitpunkte gültiger Sätze, Sprecherkennung