en

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

300 Stunden Sammlungsdaten für natürliche Swahili-Konversationen

Swahili-Sprachdatensatz
Sprachdaten aus Tansania
Swahili-Audiokorpus
Swahili-Transkriptionsdatensatz
Smartphone-Sprachdatensatz
Gesprächs-Sprachdatensatz
afrikanischer Sprachdatensatz
mehrsprachige ASR-Daten
Sprachkorpus für Sprachen mit begrenzten Ressourcen
Sprach-KI-Datensatz

Sammlung von natürlichen Swahili-Gesprächsdaten, basierend auf häufigen Themen zur Simulierung von Aufnahmen. Dieser Datensatz ist mit Textinhalt, Satzzeitstempel, Sprecheridentität, Geschlecht und weiteren Attributen annotiert und wurde von Muttersprachlern aus verschiedenen Regionen und kulturellen Hintergründen aufgenommen. Die hohe Genauigkeit stellt umfangreiche Ressourcen für Sprach­erkennungsforschung und -anwendungen bereit und wurde von mehreren KI-Unternehmen validiert: Sie hilft Modellen, auch in der Diversität der realen Welt gute Leistungen zu erzielen. Wir halten uns strikt an Datenschutzgesetze und Privatsphärevorschriften, um sicherzustellen, dass bei der Erfassung, Speicherung und Nutzung der Daten die Privatsphäre und rechtlichen Rechte der Benutzer gewahrt werden. Alle Daten entsprechen GDPR, CCPA und PIPL.

Bezahlte Datensätze
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
SpezifikationenSpezifikationen
Format
16kHz, 16bit, unkomprimiertes WAV, Mono
Inhaltskategorie
Die Aufzeichnenden wählen einige vertraute Themen aus einer bestimmten Themenliste aus und führen jeweils einen flüssigen, natürlichen Dialog auf.
Aufzeichnungsbedingungen
relativ ruhiger Innenraum, ohne Echo
Aufnahmegeräte
Android-Handy, IPhone;
Informationen der Aufnehmenden
etwa 400 Personen;
Land
Tansania
Sprache
Suaheli
Kennzeichnungsmerkmale
Annotierter Textinhalt, Satzzeitstempel, Sprecherkennung, Geschlecht, Geräuschkennzeichnung
Genauigkeit
Wortgenauigkeit 98%
Probe Probe
  • Audio

    Mmmh kwangu mimi napenda wali na njegele, [N]

  • Audio

    sababu ni chakula kinachonivutia na kinachoongeza madini mwilini.

  • Audio

    Ya hayo madini ambayo unazungumzia wewe.

  • Audio

    Kwamba yanaongeza inaongeza afya mwilini pamoja na madini.

  • Audio

    Lakini pia mimi napokula ugali na dagaa, ni chakula ambacho kinanifanya nijisikie nimeshiba. [N]

Empfohlene DatensätzeEmpfohlener Datensatz
Nennen Sie uns Ihre besonderen Bedürfnisse

Mit dem Absenden erkläre ich mich mit den Datenschutzbestimmungen einverstanden.

3d508549-04cc-4bef-8a89-26e7b706f6bf

ef3895d5-a830-4077-a85b-51f3471e4f8c