en

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

196 Stunden-Urdu(Pakistan) Spontan-Dialog-Telefonie-Sprachdatensatz

Audio
Daten
Datensatz
Konversationsdaten
asr-Daten
Urdu

Urdu-Sprachdaten_Dialoge (Telefon) zu etwa zwanzig allgemeinen Themen, um die Aufnahmen zu simulieren. Dieser Datensatz ist mit verschiedenen Attributen wie Textinhalt, Zeitstempel des Satzes, Identität des Sprechers, Geschlecht usw. versehen. Er wurde von 270 Einheimischen mit unterschiedlichem geografischem und kulturellem Hintergrund aufgezeichnet, ist sehr genau, stellt eine reichhaltige Ressource für Forschung und Anwendungen im Bereich der Spracherkennung dar und wurde von mehreren KI-Unternehmen validiert: Er hilft dem Modell, angesichts der Vielfalt der realen Welt gut abzuschneiden. Wir halten uns strikt an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung gewahrt bleiben, und zwar in Übereinstimmung mit GDPR, CCPA und PIPL.

Bezahlte Datensätze
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
SpezifikationenSpezifikationen
Formatierung
8kHz, 8bit, u-law/a-law pcm, Mono
Klassifizierung des Inhalts
Der Rekorder wählt aus einer spezifischen Themenliste mehrere bekannte Themen aus und nimmt für jedes davon einen fließenden und natürlichen Dialog auf.
Bedingungen für die Aufzeichnung
Relativ ruhiger Innenraum, kein Echo
Erfassungsgeräte
Telefon-Aufnahmesystem
Informationen zum Schreiber
Insgesamt 270 Teilnehmer, davon 150 Männer und 120 Frauen;
Land
Pakistan
Sprachgebiet Code
ur-PK
Sprache
Urdu
Kennzeichnungsmerkmale
Textinhalt-Annotation, Satz-Zeitstempel, Sprecher-Identifizierung, Geschlecht
Genauigkeit
95% Wortgenauigkeit
Probe Probe
  • Audio

    کہ یہ کرو، اور وہ کرو، اور احتیاطی تدابیر وغیرہ بھی نا۔

  • Audio

    اچھا اور جب دیکھیں، ہمارا پہلے ہوتا تھا، یہ نزلہ وغیرہ اور ہم کہتے تھے، چلو ہم،

  • Audio

    ہمم، اور دیکھیں ذرا، covid کا اور کورونا کا آج کل جو ہے، وہ اخبار اور ٹی وی میں بھی اتنا بتا رہے ہیں،

  • Audio

    ہاں تمہیں پتہ ہے نا، پچھلے دو سالوں سے سردی زیادہ ہوتی ہے، تو سردی کے موسم میں کورونا کے پھیلنے کا خطرہ بھی زیادہ ہوتا ہے۔

  • Audio

    سال میں دو، تین دفعہ تو سکول یہ کہہ کر بند کر دیے جاتے ہیں کہ کورونا کے پھیلنے کا خطرہ ہے۔

Empfohlene DatensätzeEmpfohlener Datensatz
Nennen Sie uns Ihre besonderen Bedürfnisse

Mit dem Absenden erkläre ich mich mit den Datenschutzbestimmungen einverstanden.

565e7567-d641-4ae9-a325-4fa255c06838

e27ceeb3-8562-49ff-9729-294500391d0c