[{"@type":"PropertyValue","name":"Formatierung","value":"16kHz, 16bit, unkomprimiertes WAV, Mono"},{"@type":"PropertyValue","name":"Aufnahmeumgebung","value":"Relativ ruhiger Innenraum, kein Echo"},{"@type":"PropertyValue","name":"Inhalt der Aufnahme","value":"Eine Themenliste wird bereitgestellt, aus der die Tonaufnehmer mehrere bekannte Themen auswählen, um die Fließfähigkeit und Natürlichkeit der Dialoge zu gewährleisten. Für jedes Thema führen sie einen Dialog durch und nehmen ihn auf."},{"@type":"PropertyValue","name":"Personal","value":"Insgesamt 480 Personen aus Taiwan, mit einem ausgewogenen Geschlechterverhältnis."},{"@type":"PropertyValue","name":"Kennzeichnungsmerkmale","value":"Gültige Sätze auswählen und annotieren, wobei die Annotationen die Anfangs- und Endzeitpunkte der Sätze, die Sprecher-Kennzeichnung, den Textinhalt sowie Rauschannotationen umfassen."},{"@type":"PropertyValue","name":"Land","value":"China"},{"@type":"PropertyValue","name":"Sprache","value":"Mandarin"},{"@type":"PropertyValue","name":"Anwendungsszenario","value":"Spracherkennung; Stimmabdruckerkennung"},{"@type":"PropertyValue","name":"Genauigkeit","value":"95%Satzgenauigkeit"}]
{"id":1631,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"534 Stunden-Taiwanesischer Akzent Mandarin Spontandialog Smartphone-Sprachdatensatz","datazy":[{"title":"Formatierung","desc":"Formatierung","content":"16kHz, 16bit, unkomprimiertes WAV, Mono"},{"title":"Aufnahmeumgebung","desc":"Aufnahmeumgebung","content":"Relativ ruhiger Innenraum, kein Echo"},{"title":"Inhalt der Aufnahme","desc":"Inhalt der Aufnahme","content":"Eine Themenliste wird bereitgestellt, aus der die Tonaufnehmer mehrere bekannte Themen auswählen, um die Fließfähigkeit und Natürlichkeit der Dialoge zu gewährleisten. Für jedes Thema führen sie einen Dialog durch und nehmen ihn auf."},{"title":"Personal","desc":"Personal","content":"Insgesamt 480 Personen aus Taiwan, mit einem ausgewogenen Geschlechterverhältnis."},{"title":"Kennzeichnungsmerkmale","desc":"Kennzeichnungsmerkmale","content":"Gültige Sätze auswählen und annotieren, wobei die Annotationen die Anfangs- und Endzeitpunkte der Sätze, die Sprecher-Kennzeichnung, den Textinhalt sowie Rauschannotationen umfassen."},{"title":"Land","desc":"Land","content":"China"},{"title":"Sprache","desc":"Sprache","content":"Mandarin"},{"title":"Anwendungsszenario","desc":"Anwendungsszenario","content":"Spracherkennung; Stimmabdruckerkennung"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"95%Satzgenauigkeit"}],"datatag":"Accent Mandarin,Taiwanese,Spontaneous Dialogue","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"534 Stunden natürlicher, per Mobiltelefon aufgezeichneter Sprachdaten in Mandarin mit taiwanesischem Akzent, basierend auf mehr als 30 gängigen Themen, um die Aufnahme zu simulieren. Dieser Datensatz ist mit verschiedenen Attributen wie Textinhalt, Zeitstempel des Satzes, Identität des Sprechers, Geschlecht usw. versehen. Er wurde von Menschen aus Taiwan aufgenommen, ist sehr genau und stellt eine reichhaltige Ressource für die Forschung und Anwendungen im Bereich der Spracherkennung dar und wurde von mehreren KI-Unternehmen verifiziert: Er hilft dem Modell, angesichts der Vielfalt der realen Welt gut abzuschneiden. Wir halten uns strikt an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung gewahrt bleiben und dass alle Daten mit GDPR, CCPA und PIPL übereinstimmen.","dataexampl":null,"datakeyword":["Akzent Mandarin"," Taiwanesisch"," Spontaner Dialog"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"534 Hours - Taiwanese Accent Mandarin Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
534 Stunden natürlicher, per Mobiltelefon aufgezeichneter Sprachdaten in Mandarin mit taiwanesischem Akzent, basierend auf mehr als 30 gängigen Themen, um die Aufnahme zu simulieren. Dieser Datensatz ist mit verschiedenen Attributen wie Textinhalt, Zeitstempel des Satzes, Identität des Sprechers, Geschlecht usw. versehen. Er wurde von Menschen aus Taiwan aufgenommen, ist sehr genau und stellt eine reichhaltige Ressource für die Forschung und Anwendungen im Bereich der Spracherkennung dar und wurde von mehreren KI-Unternehmen verifiziert: Er hilft dem Modell, angesichts der Vielfalt der realen Welt gut abzuschneiden. Wir halten uns strikt an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung gewahrt bleiben und dass alle Daten mit GDPR, CCPA und PIPL übereinstimmen.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Formatierung
16kHz, 16bit, unkomprimiertes WAV, Mono
Aufnahmeumgebung
Relativ ruhiger Innenraum, kein Echo
Inhalt der Aufnahme
Eine Themenliste wird bereitgestellt, aus der die Tonaufnehmer mehrere bekannte Themen auswählen, um die Fließfähigkeit und Natürlichkeit der Dialoge zu gewährleisten. Für jedes Thema führen sie einen Dialog durch und nehmen ihn auf.
Personal
Insgesamt 480 Personen aus Taiwan, mit einem ausgewogenen Geschlechterverhältnis.
Kennzeichnungsmerkmale
Gültige Sätze auswählen und annotieren, wobei die Annotationen die Anfangs- und Endzeitpunkte der Sätze, die Sprecher-Kennzeichnung, den Textinhalt sowie Rauschannotationen umfassen.