[{"@type":"PropertyValue","name":"Format","value":"16kHz, 16bit, unkomprimiertes WAV, Mono, Sprecherkanäle getrennt"},{"@type":"PropertyValue","name":"Aufnahmeumgebung","value":"relativ ruhiger Innenraum, ohne Echo"},{"@type":"PropertyValue","name":"Aufnahmeinhalt","value":"Eine Themenliste wird bereitgestellt, die Aufnehmenden wählen mehrere Themen, die ihnen vertraut sind, um einen flüssigen und natürlichen Dialog zu gewährleisten, und führen zu jedem Thema ein Gespräch, das aufgenommen wird"},{"@type":"PropertyValue","name":"Teilnehmer","value":"etwa 800 US-amerikanische Muttersprachler"},{"@type":"PropertyValue","name":"Kennzeichnungsmerkmale","value":"Nützliche Einzelsätze werden für die Kennzeichnung ausgeschnitten, das Kennzeichnungsergebnis umfasst dieStart- und Endzeitpunkte gültiger Sätze, Sprecherkennung, Textinhalt; Geräuschkennzeichnung"},{"@type":"PropertyValue","name":"Land","value":"USA"},{"@type":"PropertyValue","name":"Sprache","value":"Englisch"},{"@type":"PropertyValue","name":"Anwendungsbereich","value":"Spracherkennung; Stimmabdruckerkennung"},{"@type":"PropertyValue","name":"Genauigkeit","value":"Wortgenauigkeit 98%"}]
{"id":1770,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"600 Stunden amerikanisches Englisch, separate Spuren, natürliche Dialoge, per Mobiltelefon gesammelte Sprachdaten","datazy":[{"title":"Format","desc":"Format","content":"16kHz, 16bit, unkomprimiertes WAV, Mono, Sprecherkanäle getrennt"},{"title":"Aufnahmeumgebung","desc":"Aufnahmeumgebung","content":"relativ ruhiger Innenraum, ohne Echo"},{"title":"Aufnahmeinhalt","desc":"Aufnahmeinhalt","content":"Eine Themenliste wird bereitgestellt, die Aufnehmenden wählen mehrere Themen, die ihnen vertraut sind, um einen flüssigen und natürlichen Dialog zu gewährleisten, und führen zu jedem Thema ein Gespräch, das aufgenommen wird"},{"title":"Teilnehmer","desc":"Teilnehmer","content":"etwa 800 US-amerikanische Muttersprachler"},{"title":"Kennzeichnungsmerkmale","desc":"Kennzeichnungsmerkmale","content":"Nützliche Einzelsätze werden für die Kennzeichnung ausgeschnitten, das Kennzeichnungsergebnis umfasst dieStart- und Endzeitpunkte gültiger Sätze, Sprecherkennung, Textinhalt; Geräuschkennzeichnung"},{"title":"Land","desc":"Land","content":"USA"},{"title":"Sprache","desc":"Sprache","content":"Englisch"},{"title":"Anwendungsbereich","desc":"Anwendungsbereich","content":"Spracherkennung; Stimmabdruckerkennung"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"Wortgenauigkeit 98%"}],"datatag":"full duplex","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Amerikanisches Englisch, getrennte Spuren für natürliche Konversation, Sprachaufnahmen werden über Handys gesammelt und basieren auf häufigen Themen zur simulierten Aufnahme. Dieses Datenset annotiert Textinhalte, Satzzeitstempel, Sprecheridentität, Geschlecht und weitere Eigenschaften und wurde von US-amerikanischen Muttersprachlern aus unterschiedlichen Regionen und Kulturen aufgenommen. Es ist hochpräzise und bietet reichhaltige Ressourcen für sprachbasierte Erkennungsforschung und -anwendungen. Von mehreren KI-Unternehmen verifiziert: Es hilft Modellen, eine herausragende Leistung angesichts der Vielfalt der realen Welt zu erzielen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zur Privatsphäre, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datensammlung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.","dataexampl":null,"datakeyword":["Amerikanisches Englisch-Sprachdatensatz"," Mehrstrom-Sprachdatensatz"," Full-Duplex-Dialogdatensatz"," Spontansprechdatensatz"," Smartphone-Sprachdaten"," Mehrkanal-Audiodatensatz"," Trainingsdaten für Spracherkennung"," Dialog-KI-Datensatz"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"170 Hours - American English Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
600 Stunden amerikanisches Englisch, separate Spuren, natürliche Dialoge, per Mobiltelefon gesammelte Sprachdaten
Amerikanisches Englisch-Sprachdatensatz
Mehrstrom-Sprachdatensatz
Full-Duplex-Dialogdatensatz
Spontansprechdatensatz
Smartphone-Sprachdaten
Mehrkanal-Audiodatensatz
Trainingsdaten für Spracherkennung
Dialog-KI-Datensatz
Amerikanisches Englisch, getrennte Spuren für natürliche Konversation, Sprachaufnahmen werden über Handys gesammelt und basieren auf häufigen Themen zur simulierten Aufnahme. Dieses Datenset annotiert Textinhalte, Satzzeitstempel, Sprecheridentität, Geschlecht und weitere Eigenschaften und wurde von US-amerikanischen Muttersprachlern aus unterschiedlichen Regionen und Kulturen aufgenommen. Es ist hochpräzise und bietet reichhaltige Ressourcen für sprachbasierte Erkennungsforschung und -anwendungen. Von mehreren KI-Unternehmen verifiziert: Es hilft Modellen, eine herausragende Leistung angesichts der Vielfalt der realen Welt zu erzielen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zur Privatsphäre, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datensammlung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Eine Themenliste wird bereitgestellt, die Aufnehmenden wählen mehrere Themen, die ihnen vertraut sind, um einen flüssigen und natürlichen Dialog zu gewährleisten, und führen zu jedem Thema ein Gespräch, das aufgenommen wird
Teilnehmer
etwa 800 US-amerikanische Muttersprachler
Kennzeichnungsmerkmale
Nützliche Einzelsätze werden für die Kennzeichnung ausgeschnitten, das Kennzeichnungsergebnis umfasst dieStart- und Endzeitpunkte gültiger Sätze, Sprecherkennung, Textinhalt; Geräuschkennzeichnung