{"id":1710,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"1,503 Stunden gesprochene arabische Sprachdaten aus den Vereinigten Arabischen Emiraten","datazy":[{"title":"Format","desc":"Format","content":"16kHz, 16bit, Mono;"},{"title":"Kennzeichnungsmerkmale","desc":"Kennzeichnungsmerkmale","content":"Annotierter Textinhalt, Start- und Endzeiten gültiger Sätze, Sprecherkennung, Geschlecht;"},{"title":"Sprache","desc":"Sprache","content":"Vereinigte Arabische Emirate Arabisch;"},{"title":"Anwendungsbereiche","desc":"Anwendungsbereiche","content":"Spracherkennung, Videountertitelgenerierung, Videoinhaltsmoderation;"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"Wortgenauigkeit 98%"}],"datatag":"UAE,Conversation ","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Arabische Sprachdaten aus den Vereinigten Arabischen Emiraten – gesprochene Sprache. Sie spiegeln Interaktionen in realen Situationen wider. Dieser Datensatz enthält Annotationen wie Textinhalt, Geschlecht der Sprecher und weitere Eigenschaften und wurde von Einheimischen der VAE aus verschiedenen Regionen und kulturellen Hintergründen aufgenommen. Er zeichnet sich durch hohe Genauigkeit und Benutzerfreundlichkeit aus und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung. Dies unterstützt Modelle dabei, in der Vielfalt der realen Welt ausgezeichnete Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und -bestimmungen, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.","dataexampl":null,"datakeyword":["VAE Arabisches Sprachdatensatz"," Arabischer Sprachdatensatz"," Arabisches Konversationsdatensatz"," Arabisches Sprachkorpus"," Arabische Monolog-Sprachdaten"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1,503 Hours - Arabic(UAE) Real-world Casual Conversation and Monologue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
1,503 Stunden gesprochene arabische Sprachdaten aus den Vereinigten Arabischen Emiraten
VAE Arabisches Sprachdatensatz
Arabischer Sprachdatensatz
Arabisches Konversationsdatensatz
Arabisches Sprachkorpus
Arabische Monolog-Sprachdaten
Arabische Sprachdaten aus den Vereinigten Arabischen Emiraten – gesprochene Sprache. Sie spiegeln Interaktionen in realen Situationen wider. Dieser Datensatz enthält Annotationen wie Textinhalt, Geschlecht der Sprecher und weitere Eigenschaften und wurde von Einheimischen der VAE aus verschiedenen Regionen und kulturellen Hintergründen aufgenommen. Er zeichnet sich durch hohe Genauigkeit und Benutzerfreundlichkeit aus und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung. Dies unterstützt Modelle dabei, in der Vielfalt der realen Welt ausgezeichnete Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und -bestimmungen, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Format
16kHz, 16bit, Mono;
Kennzeichnungsmerkmale
Annotierter Textinhalt, Start- und Endzeiten gültiger Sätze, Sprecherkennung, Geschlecht;