600 Stunden amerikanisches Englisch, separate Spuren, natürliche Dialoge, per Mobiltelefon gesammelte Sprachdaten

Interspeech 2025-MLC-SLM Mehrsprachiges Dialog-Sprachwettbewerbsdatensatz

Der Hintergrund des Interspeech2025-MLC-SLM Multilingual Conversation Speech Challenge-Datensatzes ist, dass DataTang im Jahr 2025 den MLC-SLM Multilingual Conversation Speech Challenge veranstaltet hat. Der Datensatz stammt aus fünfzehn firmeneigenen Gesprächs-Sprachdatensätzen von DataTang. Die Daten sind hochpräzise, benutzerfreundlich und speziell darauf ausgelegt, die technischen Engpässe bei der mehrsprachigen Spracherkennung und dem Verständnis längerer Kontexte zu überwinden. Sie erfassen realistische komplexe Interaktionsszenarien wie Sprecherüberlagerungen und spontane Unterbrechungen und bieten reichhaltige Ressourcen für die Forschung und Anwendung im Bereich der Spracherkennung, sodass Modelle in der Lage sind, in realen, vielfältigen Szenarien hervorragende Leistungen zu zeigen. Wir halten streng die Datenschutzgesetze und -bestimmungen ein, um die Privatsphäre und die rechtlichen Interessen der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Vorschriften von GDPR, CCPA und PIPL.

Workshop-Audiodatensatz MLC-SLM-Datensatz ASR-Spracherkennungsdaten

581 Stunden gesprochene Griechisch-Daten

Griechische gesprochene Sprachdaten, deren Inhalt allgemeine Bereiche wie soziale Medien, Gespräche und Livestreams abdeckt und echte Interaktionssituationen widerspiegelt. Dieser Datensatz ist mit mehreren Attributen wie Textinhalt und Geschlecht des Sprechers annotiert und wurde von mehreren Rumänen aus verschiedenen Regionen und kulturellen Hintergründen aufgenommen. Er zeichnet sich durch hohe Genauigkeit und Benutzerfreundlichkeit aus und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung, wodurch die Modelle in der Lage sind, in realen, vielfältigen Szenarien hervorragende Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um die Privatsphäre und die rechtlichen Rechte der Benutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Bestimmungen von GDPR, CCPA und PIPL.

griechisches Sprachdatensatz griechische ASR-Trainingsdaten griechisches Konversationskorpus griechische Monologsprache griechisches Spracherkennungsdatensatz Sprache-zu-Text griechische Daten griechisches Sprachdatensatz griechisches Transkriptionsdatensatz

600 Stunden gesprochene norwegische Sprachdaten

Norwegische gesprochene Sprachdaten, deren Inhalt allgemein Bereiche wie Social Media, Dialoge und Livestream abdeckt, spiegeln echte Interaktionssituationen wider. Dieses Datenset enthält Anmerkungen zu Textinhalten, Geschlecht der Sprecher und weiteren Eigenschaften und wurde von mehreren Rumänen aus unterschiedlichen Regionen und Kulturen aufgenommen. Es zeichnet sich durch hohe Genauigkeit und einfache Handhabung aus und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung, wodurch Modelle in der Lage sind, eine herausragende Leistung in der Vielfalt der echten Welt zu zeigen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zum Schutz der Privatsphäre, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten; alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.

norwegisches Sprachdatensatz norwegische ASR-Trainingsdaten norwegisches Gesprächskorpus norwegische Monologsprache norwegisches Spracherkennungsdatensatz Sprach-zu-Text norwegische Daten norwegisches Sprachdatensatz mehrsprachige Sprachdaten norwegisches Transkriptionsdatensatz

Gesprächs-Sprachdaten im Gujarati-Skript

Gujarati-Skript-Dialog-Sprachdaten, basierend auf vorgegebenen Skripten simulierte Dialoge und Aufnahmen, die mehrere Bereiche abdecken und reichhaltige Inhalte bieten. Dieses Datenset kennzeichnet verschiedene Attribute wie Textinhalt, ist hochpräzise und bietet wertvolle Ressourcen für Forschung und Anwendungen im Bereich Spracherkennung. Dies wurde von mehreren KI-Unternehmen überprüft: Es hilft Modellen, in der Vielfalt der realen Welt hervorragende Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zum Schutz der Privatsphäre, um sicherzustellen, dass die Erfassung, Speicherung und Nutzung der Daten die Privatsphäre und rechtlichen Interessen der Nutzer wahrt. Alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.

Gujarati-Audiodatensatz Gujarati-ASR-Datensatz Gujarati-Sprachdatensatz Gujarati-TTS-Datensatz

600 Stunden philippinisches Englisch, getrennte Spuren, natürliche Dialoge, Smartphone-erfasste Sprachdaten

Philippinisches Englisch-Sprachdatenset für natürliche Konversationen, gesammelt über Mobilgeräte, nach häufigen Themen für simulierte Aufnahmen. Dieses Datenset enthält Annotationen zu Textinhalt, Satzzeitstempel, Sprecheridentität, Geschlecht und weiteren Eigenschaften. Es wurde von philippinischen Muttersprachlern aus verschiedenen Regionen und kulturellem Hintergrund aufgenommen, mit hoher Genauigkeit, und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich Spracherkennung. Es wurde von mehreren KI-Unternehmen überprüft: Es hilft Modellen, in der Vielfalt der echten Welt hervorragende Leistungen zu erzielen. Wir halten uns strikt an Datenschutzgesetze und Privatsphärenbestimmungen, um die Privatsphäre und die rechtlichen Rechte der Nutzer während der Datensammlung, -speicherung und -nutzung zu wahren. Alle Daten entsprechen den Vorschriften von GDPR, CCPA und PIPL.

Dialog-KI-Datensatz Spracherkennungs-Trainingsdaten Mehrkanal-Audiodatensatz Smartphone-Sprachdaten spontaner Sprachdatensatz Mehrstrom-Sprachdatensatz Philippinisch-Englischer Sprachdatensatz Vollduplex-Sprachdatensatz

Spanisch (Mexiko) Datensatz mit realen Alltagsgesprächen und Monologen

Mexikanische spanische gesprochene Sprachdaten, die Inhalte aus allgemeinen Bereichen wie Dialoge, Medieninhalte und Unterhaltungsvideos abdecken und reale Kommunikationssituationen widerspiegeln. Dieses Datenset ist mit verschiedenen Attributen wie Textinhalt, Sprecheridentität und Geschlecht gekennzeichnet, weist eine hohe Genauigkeit und Benutzerfreundlichkeit auf und bietet reichhaltige Ressourcen für Forschungen und Anwendungen im Bereich Spracherkennung, um Modelle in der Vielfalt der realen Welt leistungsfähig zu machen. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um die Privatsphäre und rechtlichen Rechte der Benutzer während der Datenerfassung, -speicherung und -nutzung zu schützen. Alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.

Mexiko Spanisch Alltägliche Unterhaltung ASR

460 Stunden-Schwedisch (Schweden) Real-world Casual Conversation and Monologue Sprachdatensatz

Schwedische Sprachdaten_spoken. Spiegelt reale Interaktionskontexte wider. Dieser Datensatz ist mit einer Vielzahl von Attributen wie Textinhalt, Sprecheridentität, Geschlecht usw. versehen. Er wurde von schwedischen Muttersprachlern mit unterschiedlichem geografischem und kulturellem Hintergrund aufgenommen und zeichnet sich durch hohe Genauigkeit und Benutzerfreundlichkeit aus, was eine reichhaltige Ressource für Forschung und Anwendungen im Bereich der Spracherkennung darstellt und dem Modell hilft, angesichts der Vielfalt der realen Welt gute Leistungen zu erbringen. Wir halten uns streng an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die Rechte der Nutzer bei der Datenerfassung, -speicherung und -verwendung gewahrt bleiben und dass alle Daten mit GDPR, CCPA und PIPL konform sind.

Schwedisch spontan asr

1,503 Stunden gesprochene arabische Sprachdaten aus den Vereinigten Arabischen Emiraten

Arabische Sprachdaten aus den Vereinigten Arabischen Emiraten – gesprochene Sprache. Sie spiegeln Interaktionen in realen Situationen wider. Dieser Datensatz enthält Annotationen wie Textinhalt, Geschlecht der Sprecher und weitere Eigenschaften und wurde von Einheimischen der VAE aus verschiedenen Regionen und kulturellen Hintergründen aufgenommen. Er zeichnet sich durch hohe Genauigkeit und Benutzerfreundlichkeit aus und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung. Dies unterstützt Modelle dabei, in der Vielfalt der realen Welt ausgezeichnete Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und -bestimmungen, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.

VAE Arabisches Sprachdatensatz Arabischer Sprachdatensatz Arabisches Konversationsdatensatz Arabisches Sprachkorpus Arabische Monolog-Sprachdaten

600 Stunden amerikanisches Englisch, separate Spuren, natürliche Dialoge, per Mobiltelefon gesammelte Sprachdaten

Amerikanisches Englisch-Sprachdatensatz

Mehrstrom-Sprachdatensatz

Full-Duplex-Dialogdatensatz

Spontansprechdatensatz

Smartphone-Sprachdaten

Mehrkanal-Audiodatensatz

Trainingsdaten für Spracherkennung

Dialog-KI-Datensatz

Projekt-Reifegrad

600 Stunden amerikanisches Englisch, separate Spuren, natürliche Dialoge, per Mobiltelefon gesammelte Sprachdaten

Amerikanisches Englisch-Sprachdatensatz Mehrstrom-Sprachdatensatz Full-Duplex-Dialogdatensatz Spontansprechdatensatz Smartphone-Sprachdaten Mehrkanal-Audiodatensatz Trainingsdaten für Spracherkennung Dialog-KI-Datensatz

Projekt-Reifegrad

Amerikanisches Englisch-Sprachdatensatz

Mehrstrom-Sprachdatensatz

Full-Duplex-Dialogdatensatz

Spontansprechdatensatz

Smartphone-Sprachdaten

Mehrkanal-Audiodatensatz

Trainingsdaten für Spracherkennung

Dialog-KI-Datensatz