[{"@type":"PropertyValue","name":"Formatierung","value":"8kHz, 8bit, u-law/a-law pcm, Mono"},{"@type":"PropertyValue","name":"Klassifizierung des Inhalts","value":"Der Rekorder wählt aus einer spezifischen Themenliste mehrere bekannte Themen aus und nimmt für jedes davon einen fließenden und natürlichen Dialog auf."},{"@type":"PropertyValue","name":"Bedingungen für die Aufzeichnung","value":"Relativ ruhiger Innenraum, kein Echo"},{"@type":"PropertyValue","name":"Erfassungsgeräte","value":"Telefon-Aufnahmesystem"},{"@type":"PropertyValue","name":"Informationen zum Schreiber","value":"Insgesamt 270 Teilnehmer, davon 150 Männer und 120 Frauen;"},{"@type":"PropertyValue","name":"Land","value":"Pakistan"},{"@type":"PropertyValue","name":"Sprachgebiet Code","value":"ur-PK"},{"@type":"PropertyValue","name":"Sprache","value":"Urdu"},{"@type":"PropertyValue","name":"Kennzeichnungsmerkmale","value":"Textinhalt-Annotation, Satz-Zeitstempel, Sprecher-Identifizierung, Geschlecht"},{"@type":"PropertyValue","name":"Genauigkeit","value":"95% Wortgenauigkeit"}]
{"id":1242,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"196 Stunden-Urdu(Pakistan) Spontan-Dialog-Telefonie-Sprachdatensatz","datazy":[{"title":"Formatierung","desc":"Formatierung","content":"8kHz, 8bit, u-law/a-law pcm, Mono"},{"title":"Klassifizierung des Inhalts","desc":"Klassifizierung des Inhalts","content":"Der Rekorder wählt aus einer spezifischen Themenliste mehrere bekannte Themen aus und nimmt für jedes davon einen fließenden und natürlichen Dialog auf."},{"title":"Bedingungen für die Aufzeichnung","desc":"Bedingungen für die Aufzeichnung","content":"Relativ ruhiger Innenraum, kein Echo"},{"title":"Erfassungsgeräte","desc":"Erfassungsgeräte","content":"Telefon-Aufnahmesystem"},{"title":"Informationen zum Schreiber","desc":"Informationen zum Schreiber","content":"Insgesamt 270 Teilnehmer, davon 150 Männer und 120 Frauen;"},{"title":"Land","desc":"Land","content":"Pakistan"},{"title":"Sprachgebiet Code","desc":"Sprachgebiet Code","content":"ur-PK"},{"title":"Sprache","desc":"Sprache","content":"Urdu"},{"title":"Kennzeichnungsmerkmale","desc":"Kennzeichnungsmerkmale","content":"Textinhalt-Annotation, Satz-Zeitstempel, Sprecher-Identifizierung, Geschlecht"},{"title":"Genauigkeit","desc":"Genauigkeit","content":"95% Wortgenauigkeit"}],"datatag":"Conversational Speech,Telephone,Urdu","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-7.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-7.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=9OFuuaPAmeNan5off2%2F6oj%2BT6%2Bw%3D","intro":"کہ یہ کرو، اور وہ کرو، اور احتیاطی تدابیر وغیرہ بھی نا۔","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-9.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-9.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=SRkh%2BMPsFh9MiaZbCmASEAV82LA%3D","intro":"اچھا اور جب دیکھیں، ہمارا پہلے ہوتا تھا، یہ نزلہ وغیرہ اور ہم کہتے تھے، چلو ہم،","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-6.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-6.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ve42CpgQON0aVljdvvM9DEJh7%2B4%3D","intro":"ہمم، اور دیکھیں ذرا، covid کا اور کورونا کا آج کل جو ہے، وہ اخبار اور ٹی وی میں بھی اتنا بتا رہے ہیں،","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-1.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-1.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=4Rr5svFZ%2B0AjTuqo2uuw%2BcbWjmY%3D","intro":"ہاں تمہیں پتہ ہے نا، پچھلے دو سالوں سے سردی زیادہ ہوتی ہے، تو سردی کے موسم میں کورونا کے پھیلنے کا خطرہ بھی زیادہ ہوتا ہے۔","size":0,"progress":100,"type":"mp3"},{"name":"/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-5.wav","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230716001_demo1725530400187/APY230716001_demo/cov_001_00202_8k-5.wav?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=15Ai6ApMMr3pFZ%2FpXohi3SeWm6U%3D","intro":"سال میں دو، تین دفعہ تو سکول یہ کہہ کر بند کر دیے جاتے ہیں کہ کورونا کے پھیلنے کا خطرہ ہے۔","size":0,"progress":100,"type":"mp3"}],"officialSummary":"Urdu-Sprachdaten_Dialoge (Telefon) zu etwa zwanzig allgemeinen Themen, um die Aufnahmen zu simulieren. Dieser Datensatz ist mit verschiedenen Attributen wie Textinhalt, Zeitstempel des Satzes, Identität des Sprechers, Geschlecht usw. versehen. Er wurde von 270 Einheimischen mit unterschiedlichem geografischem und kulturellem Hintergrund aufgezeichnet, ist sehr genau, stellt eine reichhaltige Ressource für Forschung und Anwendungen im Bereich der Spracherkennung dar und wurde von mehreren KI-Unternehmen validiert: Er hilft dem Modell, angesichts der Vielfalt der realen Welt gut abzuschneiden. Wir halten uns strikt an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung gewahrt bleiben, und zwar in Übereinstimmung mit GDPR, CCPA und PIPL.","dataexampl":null,"datakeyword":["Audio"," Daten"," Datensatz"," Konversationsdaten"," asr-Daten"," Urdu"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Data Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"196 Hours - Urdu Conversational Speech Data by Telephone","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
Urdu-Sprachdaten_Dialoge (Telefon) zu etwa zwanzig allgemeinen Themen, um die Aufnahmen zu simulieren. Dieser Datensatz ist mit verschiedenen Attributen wie Textinhalt, Zeitstempel des Satzes, Identität des Sprechers, Geschlecht usw. versehen. Er wurde von 270 Einheimischen mit unterschiedlichem geografischem und kulturellem Hintergrund aufgezeichnet, ist sehr genau, stellt eine reichhaltige Ressource für Forschung und Anwendungen im Bereich der Spracherkennung dar und wurde von mehreren KI-Unternehmen validiert: Er hilft dem Modell, angesichts der Vielfalt der realen Welt gut abzuschneiden. Wir halten uns strikt an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung gewahrt bleiben, und zwar in Übereinstimmung mit GDPR, CCPA und PIPL.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Formatierung
8kHz, 8bit, u-law/a-law pcm, Mono
Klassifizierung des Inhalts
Der Rekorder wählt aus einer spezifischen Themenliste mehrere bekannte Themen aus und nimmt für jedes davon einen fließenden und natürlichen Dialog auf.
Bedingungen für die Aufzeichnung
Relativ ruhiger Innenraum, kein Echo
Erfassungsgeräte
Telefon-Aufnahmesystem
Informationen zum Schreiber
Insgesamt 270 Teilnehmer, davon 150 Männer und 120 Frauen;