[{"@type":"PropertyValue","name":"Format","value":"16kHz, 16bit, unkomprimiertes WAV, Mono"},{"@type":"PropertyValue","name":"Inhaltskategorie","value":"Freies Gespräch der Aufzeichner, separate Dateien für jeden Sprecher"},{"@type":"PropertyValue","name":"Aufnahmebedingungen","value":"relativ ruhiger Innenraum, ohne Echo"},{"@type":"PropertyValue","name":"Aufnahmegeräte","value":"Android-Handy, IPhone"},{"@type":"PropertyValue","name":"Informationen der Aufnehmenden","value":"Etwa 200 Personen"},{"@type":"PropertyValue","name":"Land","value":"Südkorea"},{"@type":"PropertyValue","name":"Sprache","value":"Koreanisch"},{"@type":"PropertyValue","name":"Kennzeichnungsmerkmale","value":"Annotierter Textinhalt, Satzzeitstempel, Sprecherkennung, Geschlecht"},{"@type":"PropertyValue","name":"Genauigkeit","value":"Wortgenauigkeit 98%"}]
{"id":1704,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"200 Stunden Koreanisches Voll-Duplex Mehrkanal-Sprachdatenset","datazy":[{"title":"Format","content":"16kHz, 16bit, unkomprimiertes WAV, Mono","desc":"Format"},{"title":"Inhaltskategorie","content":"Freies Gespräch der Aufzeichner, separate Dateien für jeden Sprecher","desc":"Inhaltskategorie"},{"title":"Aufnahmebedingungen","content":"relativ ruhiger Innenraum, ohne Echo","desc":"Aufnahmebedingungen"},{"title":"Aufnahmegeräte","content":"Android-Handy, IPhone","desc":"Aufnahmegeräte"},{"title":"Informationen der Aufnehmenden","content":"Etwa 200 Personen","desc":"Informationen der Aufnehmenden"},{"title":"Land","content":"Südkorea","desc":"Land"},{"title":"Sprache","content":"Koreanisch","desc":"Sprache"},{"title":"Kennzeichnungsmerkmale","content":"Annotierter Textinhalt, Satzzeitstempel, Sprecherkennung, Geschlecht","desc":"Kennzeichnungsmerkmale"},{"title":"Genauigkeit","content":"Wortgenauigkeit 98%","desc":"Genauigkeit"}],"datatag":"korean,korea,multi-stream,Dialogue ,full duplex","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"00005_002_1_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_1_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=NlsqZnHGAvbSvVH1OEhwiTk5wzY%3D","intro":"오케이 오케이.","size":43724,"progress":100,"type":"mp3"},{"name":"00005_002_1_phone-3.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_1_phone-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=zkhIVWAhS3uKo2h%2BkJ%2BWwrsCANQ%3D","intro":"여행 여행 요즘 뭐 여행가고 싶은데 없어?","size":223820,"progress":100,"type":"mp3"},{"name":"00005_002_2_phone-1.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_2_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=SE4CYmf6ut37dAFxAogB7QNagKo%3D","intro":"어, 네, 저는 목소리가 엄청 작게 들리는데 원래 이런가?","size":160700,"progress":100,"type":"mp3"},{"name":"00005_002_2_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_2_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=wNJqEzby78LskY9GS8bSn0VrYow%3D","intro":"아, 그래요? 이건 어쩔 수 없나 봐요, 끊기진 않은데 저는.","size":167180,"progress":100,"type":"mp3"},{"name":"00005_002_2_phone-6.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_2_phone-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=eNXO3T2Q0J8MypsJ1mFZGhLYv1o%3D","intro":"저번에 여행 갔다 오고 나서 이제","size":153452,"progress":100,"type":"mp3"}],"officialSummary":"Voll-duplex koreanische natürliche Gesprächs-Sprachdaten, die über Mobiltelefone gesammelt wurden, basierend auf gängigen Themen simuliert aufgezeichnet. Dieses Datenset enthält Annotationen zu Textinhalt, Satzzeitstempel, Sprecheridentität, Geschlecht und weiteren Eigenschaften. Es wurde von koreanischen Muttersprachlern aus verschiedenen Regionen und kulturellen Hintergründen aufgenommen, ist hochpräzise und bietet reichhaltige Ressourcen für die Forschung und Anwendungen der Spracherkennung. Mehrere KI-Unternehmen haben bestätigt, dass es dazu beiträgt, dass Modelle in der realen Welt vielseitig und leistungsstark agieren können. Wir halten strikt die Datenschutzgesetze und Vorschriften zum Schutz der Privatsphäre ein, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datensammlung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.","dataexampl":null,"datakeyword":["Korean-Sprachdatensatz"," spontanes koreanisches Dialog"," Multistream-Audiodatensatz"," konversationelles koreanisches Sprachmaterial"," auf dem Smartphone aufgenommenes Audio"," Dual-Speaker-Datensatz"," realistische koreanische Gespräche"," Full-Duplex-Sprachdatensatz"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"214 Hours - Korean(Korea) Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Voll-duplex koreanische natürliche Gesprächs-Sprachdaten, die über Mobiltelefone gesammelt wurden, basierend auf gängigen Themen simuliert aufgezeichnet. Dieses Datenset enthält Annotationen zu Textinhalt, Satzzeitstempel, Sprecheridentität, Geschlecht und weiteren Eigenschaften. Es wurde von koreanischen Muttersprachlern aus verschiedenen Regionen und kulturellen Hintergründen aufgenommen, ist hochpräzise und bietet reichhaltige Ressourcen für die Forschung und Anwendungen der Spracherkennung. Mehrere KI-Unternehmen haben bestätigt, dass es dazu beiträgt, dass Modelle in der realen Welt vielseitig und leistungsstark agieren können. Wir halten strikt die Datenschutzgesetze und Vorschriften zum Schutz der Privatsphäre ein, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datensammlung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Format
16kHz, 16bit, unkomprimiertes WAV, Mono
Inhaltskategorie
Freies Gespräch der Aufzeichner, separate Dateien für jeden Sprecher