[{"@type":"PropertyValue","name":"Formatierung","value":"16kHz, 16bit, Mono, WAV-Datei"},{"@type":"PropertyValue","name":"Klassifizierung des Inhalts","value":"Der Inhalt umfasst mehrere Bereiche wie Variety, Interviews, Dialoge, Reviews usw."},{"@type":"PropertyValue","name":"Aufnahmeumgebung","value":"Geringer Lärm"},{"@type":"PropertyValue","name":"Kennzeichnungsmerkmale","value":"Gelabelter Textinhalt, Beginn und Ende gültiger Sätze, Sprecheridentifikation, Geschlecht, Rauschmarkierung."},{"@type":"PropertyValue","name":"Sprache","value":"Türkisch"},{"@type":"PropertyValue","name":"Sprachgebiet Code","value":"tr-TR"},{"@type":"PropertyValue","name":"Land","value":"Türkische Republik"},{"@type":"PropertyValue","name":"Anwendungsszenario","value":"Spracherkennung, Erzeugung von Untertiteln, Überprüfung des Inhalts"},{"@type":"PropertyValue","name":"Genauigkeit","value":"98% Wortgenauigkeit"}]
{"id":1324,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"504 Stunden-Türkisch (Türkei) Real-world Casual Conversation and Monologue speech dataset","datazy":[{"title":"Formatierung","desc":"Formatierung","content":"16kHz, 16bit, Mono, WAV-Datei"},{"title":"Klassifizierung des Inhalts","desc":"Klassifizierung des Inhalts","content":"Der Inhalt umfasst mehrere Bereiche wie Variety, Interviews, Dialoge, Reviews usw."},{"title":"Aufnahmeumgebung","desc":"Aufnahmeumgebung","content":"Geringer Lärm"},{"title":"Kennzeichnungsmerkmale","desc":"Kennzeichnungsmerkmale","content":"Gelabelter Textinhalt, Beginn und Ende gültiger Sätze, Sprecheridentifikation, Geschlecht, Rauschmarkierung."},{"title":"Sprache","desc":"Sprache","content":"Türkisch"},{"title":"Sprachgebiet Code","desc":"Sprachgebiet Code","content":"tr-TR"},{"title":"Land","desc":"Land","content":"Türkische Republik"},{"title":"Anwendungsszenario","desc":"Anwendungsszenario","content":"Spracherkennung, Erzeugung von Untertiteln, Überprüfung des Inhalts"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"98% Wortgenauigkeit"}],"datatag":"Turkish,Colloquial Video,Asr","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"Türkische Sprachdaten_gesprochen, mit Inhalten, die ein breites Spektrum an generischen Bereichen abdecken, wie z. B. Selbstdarstellung, Gespräche, Live-Streaming usw., die reale Interaktionskontexte widerspiegeln. Dieser Datensatz ist mit einer Vielzahl von Attributen wie Textinhalt, Sprecheridentität, Geschlecht usw. versehen. Er ist äußerst genau und einfach zu verwenden und stellt eine reichhaltige Ressource für Forschung und Anwendungen im Bereich der Spracherkennung dar und wurde von einer Reihe von KI-Unternehmen verifiziert: Er hilft dem Modell, angesichts der Vielfalt der realen Welt gut abzuschneiden. Wir halten uns strikt an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die gesetzlichen Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung gewahrt bleiben und dass alle Daten mit GDPR, CCPA und PIPL konform sind.","dataexampl":null,"datakeyword":["Spontan"," Sprechen"," Türkisch"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"1,620 Hours - Turkish Real-world Casual Conversation and Monologue speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
504 Stunden-Türkisch (Türkei) Real-world Casual Conversation and Monologue speech dataset
Spontan
Sprechen
Türkisch
Türkische Sprachdaten_gesprochen, mit Inhalten, die ein breites Spektrum an generischen Bereichen abdecken, wie z. B. Selbstdarstellung, Gespräche, Live-Streaming usw., die reale Interaktionskontexte widerspiegeln. Dieser Datensatz ist mit einer Vielzahl von Attributen wie Textinhalt, Sprecheridentität, Geschlecht usw. versehen. Er ist äußerst genau und einfach zu verwenden und stellt eine reichhaltige Ressource für Forschung und Anwendungen im Bereich der Spracherkennung dar und wurde von einer Reihe von KI-Unternehmen verifiziert: Er hilft dem Modell, angesichts der Vielfalt der realen Welt gut abzuschneiden. Wir halten uns strikt an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die gesetzlichen Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung gewahrt bleiben und dass alle Daten mit GDPR, CCPA und PIPL konform sind.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Formatierung
16kHz, 16bit, Mono, WAV-Datei
Klassifizierung des Inhalts
Der Inhalt umfasst mehrere Bereiche wie Variety, Interviews, Dialoge, Reviews usw.
Aufnahmeumgebung
Geringer Lärm
Kennzeichnungsmerkmale
Gelabelter Textinhalt, Beginn und Ende gültiger Sätze, Sprecheridentifikation, Geschlecht, Rauschmarkierung.
Sprache
Türkisch
Sprachgebiet Code
tr-TR
Land
Türkische Republik
Anwendungsszenario
Spracherkennung, Erzeugung von Untertiteln, Überprüfung des Inhalts