en

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

Interspeech 2025-MLC-SLM Mehrsprachiges Dialog-Sprachwettbewerbsdatensatz

Workshop-Audiodatensatz
MLC-SLM-Datensatz
ASR-Spracherkennungsdaten

Der Hintergrund des Interspeech2025-MLC-SLM Multilingual Conversation Speech Challenge-Datensatzes ist, dass DataTang im Jahr 2025 den MLC-SLM Multilingual Conversation Speech Challenge veranstaltet hat. Der Datensatz stammt aus fünfzehn firmeneigenen Gesprächs-Sprachdatensätzen von DataTang. Die Daten sind hochpräzise, benutzerfreundlich und speziell darauf ausgelegt, die technischen Engpässe bei der mehrsprachigen Spracherkennung und dem Verständnis längerer Kontexte zu überwinden. Sie erfassen realistische komplexe Interaktionsszenarien wie Sprecherüberlagerungen und spontane Unterbrechungen und bieten reichhaltige Ressourcen für die Forschung und Anwendung im Bereich der Spracherkennung, sodass Modelle in der Lage sind, in realen, vielfältigen Szenarien hervorragende Leistungen zu zeigen. Wir halten streng die Datenschutzgesetze und -bestimmungen ein, um die Privatsphäre und die rechtlichen Interessen der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Vorschriften von GDPR, CCPA und PIPL.

Bezahlte Datensätze
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
SpezifikationenSpezifikationen
Format
16kHz, 16bit, unkomprimiertes WAV, Mono
Aufnahmeumgebung
relativ ruhiger Innenraum, ohne Echo
Aufnahmeinhalt
Eine Themenliste wird bereitgestellt, der Sprecher wählt mehrere ihm vertraute Themen aus, um einen flüssigen und natürlichen Dialog zu gewährleisten, und führt zu jedem Thema ein Gespräch, das aufgezeichnet wird
Kennzeichnungsmerkmale
Annotierter Textinhalt, Start- und Endzeitpunkte gültiger Sätze, Sprecherkennung
Geräte
Android-Handy, IPhone
Sprache
Amerikanisches Englisch, Britisches Englisch, Philippinisches Englisch, Australisches Englisch, Indisches Englisch, Französisch, Deutsch, Italienisch, Japanisch, Koreanisch, Portugiesisch, Russisch, Spanisch, Thailändisch, Vietnamesisch.
Probe Probe
  • Audio

    one direction is the first thing like in the mind

  • Audio

    Parce que j'ai plus l'ancien, j'en ai que celui-là dorénavant.

  • Audio

    D'accord très bien l'autre, je vais l'effacer alors.

  • Audio

    조금 이제 날씨도 더워지는데 덜 답답하구

  • Audio

    이천치십 년이랑 이천이십일 년 진짜 학교 못 간게

Empfohlene DatensätzeEmpfohlener Datensatz
Nennen Sie uns Ihre besonderen Bedürfnisse

Mit dem Absenden erkläre ich mich mit den Datenschutzbestimmungen einverstanden.

3f99e050-8814-4566-9261-555c5cbe5f08

b785ac2d-74ea-4b99-9d1c-a9e1c781b472