[{"@type":"PropertyValue","name":"Format","value":"16kHz, 16bit, unkomprimiertes WAV, Mono, getrennte Kanäle für Sprecher"},{"@type":"PropertyValue","name":"Aufnahmeumgebung","value":"relativ ruhiger Innenraum, ohne Echo"},{"@type":"PropertyValue","name":"Aufnahmeinhalt","value":"Eine Themenliste wird bereitgestellt, und die Sprecher wählen mehrere vertraute Themen aus, um einen flüssigen und natürlichen Dialog zu gewährleisten. Zu jedem Thema wird ein Dialog geführt und aufgenommen."},{"@type":"PropertyValue","name":"Teilnehmer","value":"etwa 1,500 einheimische Philippine"},{"@type":"PropertyValue","name":"Kennzeichnungsmerkmale","value":"Nützliche Einzelsätze werden für die Kennzeichnung ausgeschnitten, das Kennzeichnungsergebnis umfasst die Start- und Endzeitpunkte gültiger Sätze, Sprecherkennung, Textinhalt; Geräuschkennzeichnung"},{"@type":"PropertyValue","name":"Land","value":"Philippinen"},{"@type":"PropertyValue","name":"Sprache","value":"Tagalog"},{"@type":"PropertyValue","name":"Anwendungsbereich","value":"Spracherkennung; Stimmabdruckerkennung"},{"@type":"PropertyValue","name":"Genauigkeit","value":"Wortgenauigkeit 98%"}]
{"id":1700,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"1,100 Stunden gesammelte Sprachdaten natürlicher Dialoge auf Tagalog per Handy","datazy":[{"title":"Format","desc":"Format","content":"16kHz, 16bit, unkomprimiertes WAV, Mono, getrennte Kanäle für Sprecher"},{"title":"Aufnahmeumgebung","desc":"Aufnahmeumgebung","content":"relativ ruhiger Innenraum, ohne Echo"},{"title":"Aufnahmeinhalt","desc":"Aufnahmeinhalt","content":"Eine Themenliste wird bereitgestellt, und die Sprecher wählen mehrere vertraute Themen aus, um einen flüssigen und natürlichen Dialog zu gewährleisten. Zu jedem Thema wird ein Dialog geführt und aufgenommen."},{"title":"Teilnehmer","desc":"Teilnehmer","content":"etwa 1,500 einheimische Philippine"},{"title":"Kennzeichnungsmerkmale","desc":"Kennzeichnungsmerkmale","content":"Nützliche Einzelsätze werden für die Kennzeichnung ausgeschnitten, das Kennzeichnungsergebnis umfasst die Start- und Endzeitpunkte gültiger Sätze, Sprecherkennung, Textinhalt; Geräuschkennzeichnung"},{"title":"Land","desc":"Land","content":"Philippinen"},{"title":"Sprache","desc":"Sprache","content":"Tagalog"},{"title":"Anwendungsbereich","desc":"Anwendungsbereich","content":"Spracherkennung; Stimmabdruckerkennung"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"Wortgenauigkeit 98%"}],"datatag":" full duplex","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Die philippinische Sprachaufnahme für natürliche Konversationen wurde über mobile Geräte gesammelt, basierend auf häufigen Themen simuliert. Dieser Datensatz enthält Annotationen wie Textinhalt, Satzzeitstempel, Sprecheridentität, Geschlecht und weitere Eigenschaften. Er wurde von philippinischen Muttersprachlern aus unterschiedlichen Regionen und kulturellen Hintergründen aufgenommen, weist eine hohe Genauigkeit auf und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich Spracherkennung. Mehrere AI-Unternehmen haben die Qualität überprüft: Der Datensatz hilft Modellen, in der realen Welt mit Vielfalt exzellente Leistung zu erzielen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zur Privatsphäre, um die Privatsphäre und die Rechte der Nutzer während der Datenerfassung, Speicherung und Nutzung zu schützen. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.","dataexampl":null,"datakeyword":["Mehrkanal-Sprachdatensatz"," Voll-Duplex-Dialogdatensatz"," Mehrkanal-Audiodatensatz"," Trainingsdaten für Spracherkennung"," Mehrkanal-Stimmendatensatz"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"950 Hours - Tagalog Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
1,100 Stunden gesammelte Sprachdaten natürlicher Dialoge auf Tagalog per Handy
Mehrkanal-Sprachdatensatz
Voll-Duplex-Dialogdatensatz
Mehrkanal-Audiodatensatz
Trainingsdaten für Spracherkennung
Mehrkanal-Stimmendatensatz
Die philippinische Sprachaufnahme für natürliche Konversationen wurde über mobile Geräte gesammelt, basierend auf häufigen Themen simuliert. Dieser Datensatz enthält Annotationen wie Textinhalt, Satzzeitstempel, Sprecheridentität, Geschlecht und weitere Eigenschaften. Er wurde von philippinischen Muttersprachlern aus unterschiedlichen Regionen und kulturellen Hintergründen aufgenommen, weist eine hohe Genauigkeit auf und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich Spracherkennung. Mehrere AI-Unternehmen haben die Qualität überprüft: Der Datensatz hilft Modellen, in der realen Welt mit Vielfalt exzellente Leistung zu erzielen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zur Privatsphäre, um die Privatsphäre und die Rechte der Nutzer während der Datenerfassung, Speicherung und Nutzung zu schützen. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Format
16kHz, 16bit, unkomprimiertes WAV, Mono, getrennte Kanäle für Sprecher
Aufnahmeumgebung
relativ ruhiger Innenraum, ohne Echo
Aufnahmeinhalt
Eine Themenliste wird bereitgestellt, und die Sprecher wählen mehrere vertraute Themen aus, um einen flüssigen und natürlichen Dialog zu gewährleisten. Zu jedem Thema wird ein Dialog geführt und aufgenommen.
Teilnehmer
etwa 1,500 einheimische Philippine
Kennzeichnungsmerkmale
Nützliche Einzelsätze werden für die Kennzeichnung ausgeschnitten, das Kennzeichnungsergebnis umfasst die Start- und Endzeitpunkte gültiger Sätze, Sprecherkennung, Textinhalt; Geräuschkennzeichnung