1,100 Stunden gesammelte Sprachdaten natürlicher Dialoge auf Tagalog per Handy

Mehrkanal-Sprachdatensatz

Voll-Duplex-Dialogdatensatz

Mehrkanal-Audiodatensatz

Trainingsdaten für Spracherkennung

Mehrkanal-Stimmendatensatz

Die philippinische Sprachaufnahme für natürliche Konversationen wurde über mobile Geräte gesammelt, basierend auf häufigen Themen simuliert. Dieser Datensatz enthält Annotationen wie Textinhalt, Satzzeitstempel, Sprecheridentität, Geschlecht und weitere Eigenschaften. Er wurde von philippinischen Muttersprachlern aus unterschiedlichen Regionen und kulturellen Hintergründen aufgenommen, weist eine hohe Genauigkeit auf und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich Spracherkennung. Mehrere AI-Unternehmen haben die Qualität überprüft: Der Datensatz hilft Modellen, in der realen Welt mit Vielfalt exzellente Leistung zu erzielen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zur Privatsphäre, um die Privatsphäre und die Rechte der Nutzer während der Datenerfassung, Speicherung und Nutzung zu schützen. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.

Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.

Spezifikationen

Format

16kHz, 16bit, unkomprimiertes WAV, Mono, getrennte Kanäle für Sprecher

Aufnahmeumgebung

relativ ruhiger Innenraum, ohne Echo

Aufnahmeinhalt

Eine Themenliste wird bereitgestellt, und die Sprecher wählen mehrere vertraute Themen aus, um einen flüssigen und natürlichen Dialog zu gewährleisten. Zu jedem Thema wird ein Dialog geführt und aufgenommen.

Teilnehmer

etwa 1,500 einheimische Philippine

Kennzeichnungsmerkmale

Nützliche Einzelsätze werden für die Kennzeichnung ausgeschnitten, das Kennzeichnungsergebnis umfasst die Start- und Endzeitpunkte gültiger Sätze, Sprecherkennung, Textinhalt; Geräuschkennzeichnung

Land

Philippinen

Sprache

Tagalog

Anwendungsbereich

Spracherkennung; Stimmabdruckerkennung

Genauigkeit

Wortgenauigkeit 98%

Empfohlener Datensatz

Interspeech 2025-MLC-SLM Mehrsprachiges Dialog-Sprachwettbewerbsdatensatz

Der Hintergrund des Interspeech2025-MLC-SLM Multilingual Conversation Speech Challenge-Datensatzes ist, dass DataTang im Jahr 2025 den MLC-SLM Multilingual Conversation Speech Challenge veranstaltet hat. Der Datensatz stammt aus fünfzehn firmeneigenen Gesprächs-Sprachdatensätzen von DataTang. Die Daten sind hochpräzise, benutzerfreundlich und speziell darauf ausgelegt, die technischen Engpässe bei der mehrsprachigen Spracherkennung und dem Verständnis längerer Kontexte zu überwinden. Sie erfassen realistische komplexe Interaktionsszenarien wie Sprecherüberlagerungen und spontane Unterbrechungen und bieten reichhaltige Ressourcen für die Forschung und Anwendung im Bereich der Spracherkennung, sodass Modelle in der Lage sind, in realen, vielfältigen Szenarien hervorragende Leistungen zu zeigen. Wir halten streng die Datenschutzgesetze und -bestimmungen ein, um die Privatsphäre und die rechtlichen Interessen der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Vorschriften von GDPR, CCPA und PIPL.

Workshop-Audiodatensatz MLC-SLM-Datensatz ASR-Spracherkennungsdaten

581 Stunden gesprochene Griechisch-Daten

Griechische gesprochene Sprachdaten, deren Inhalt allgemeine Bereiche wie soziale Medien, Gespräche und Livestreams abdeckt und echte Interaktionssituationen widerspiegelt. Dieser Datensatz ist mit mehreren Attributen wie Textinhalt und Geschlecht des Sprechers annotiert und wurde von mehreren Rumänen aus verschiedenen Regionen und kulturellen Hintergründen aufgenommen. Er zeichnet sich durch hohe Genauigkeit und Benutzerfreundlichkeit aus und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung, wodurch die Modelle in der Lage sind, in realen, vielfältigen Szenarien hervorragende Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um die Privatsphäre und die rechtlichen Rechte der Benutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Bestimmungen von GDPR, CCPA und PIPL.

griechisches Sprachdatensatz griechische ASR-Trainingsdaten griechisches Konversationskorpus griechische Monologsprache griechisches Spracherkennungsdatensatz Sprache-zu-Text griechische Daten griechisches Sprachdatensatz griechisches Transkriptionsdatensatz

600 Stunden gesprochene norwegische Sprachdaten

Norwegische gesprochene Sprachdaten, deren Inhalt allgemein Bereiche wie Social Media, Dialoge und Livestream abdeckt, spiegeln echte Interaktionssituationen wider. Dieses Datenset enthält Anmerkungen zu Textinhalten, Geschlecht der Sprecher und weiteren Eigenschaften und wurde von mehreren Rumänen aus unterschiedlichen Regionen und Kulturen aufgenommen. Es zeichnet sich durch hohe Genauigkeit und einfache Handhabung aus und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung, wodurch Modelle in der Lage sind, eine herausragende Leistung in der Vielfalt der echten Welt zu zeigen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zum Schutz der Privatsphäre, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten; alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.

norwegisches Sprachdatensatz norwegische ASR-Trainingsdaten norwegisches Gesprächskorpus norwegische Monologsprache norwegisches Spracherkennungsdatensatz Sprach-zu-Text norwegische Daten norwegisches Sprachdatensatz mehrsprachige Sprachdaten norwegisches Transkriptionsdatensatz

Gesprächs-Sprachdaten im Gujarati-Skript

Gujarati-Skript-Dialog-Sprachdaten, basierend auf vorgegebenen Skripten simulierte Dialoge und Aufnahmen, die mehrere Bereiche abdecken und reichhaltige Inhalte bieten. Dieses Datenset kennzeichnet verschiedene Attribute wie Textinhalt, ist hochpräzise und bietet wertvolle Ressourcen für Forschung und Anwendungen im Bereich Spracherkennung. Dies wurde von mehreren KI-Unternehmen überprüft: Es hilft Modellen, in der Vielfalt der realen Welt hervorragende Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zum Schutz der Privatsphäre, um sicherzustellen, dass die Erfassung, Speicherung und Nutzung der Daten die Privatsphäre und rechtlichen Interessen der Nutzer wahrt. Alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.

Gujarati-Audiodatensatz Gujarati-ASR-Datensatz Gujarati-Sprachdatensatz Gujarati-TTS-Datensatz

600 Stunden philippinisches Englisch, getrennte Spuren, natürliche Dialoge, Smartphone-erfasste Sprachdaten

Philippinisches Englisch-Sprachdatenset für natürliche Konversationen, gesammelt über Mobilgeräte, nach häufigen Themen für simulierte Aufnahmen. Dieses Datenset enthält Annotationen zu Textinhalt, Satzzeitstempel, Sprecheridentität, Geschlecht und weiteren Eigenschaften. Es wurde von philippinischen Muttersprachlern aus verschiedenen Regionen und kulturellem Hintergrund aufgenommen, mit hoher Genauigkeit, und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich Spracherkennung. Es wurde von mehreren KI-Unternehmen überprüft: Es hilft Modellen, in der Vielfalt der echten Welt hervorragende Leistungen zu erzielen. Wir halten uns strikt an Datenschutzgesetze und Privatsphärenbestimmungen, um die Privatsphäre und die rechtlichen Rechte der Nutzer während der Datensammlung, -speicherung und -nutzung zu wahren. Alle Daten entsprechen den Vorschriften von GDPR, CCPA und PIPL.

Dialog-KI-Datensatz Spracherkennungs-Trainingsdaten Mehrkanal-Audiodatensatz Smartphone-Sprachdaten spontaner Sprachdatensatz Mehrstrom-Sprachdatensatz Philippinisch-Englischer Sprachdatensatz Vollduplex-Sprachdatensatz

600 Stunden amerikanisches Englisch, separate Spuren, natürliche Dialoge, per Mobiltelefon gesammelte Sprachdaten

Amerikanisches Englisch, getrennte Spuren für natürliche Konversation, Sprachaufnahmen werden über Handys gesammelt und basieren auf häufigen Themen zur simulierten Aufnahme. Dieses Datenset annotiert Textinhalte, Satzzeitstempel, Sprecheridentität, Geschlecht und weitere Eigenschaften und wurde von US-amerikanischen Muttersprachlern aus unterschiedlichen Regionen und Kulturen aufgenommen. Es ist hochpräzise und bietet reichhaltige Ressourcen für sprachbasierte Erkennungsforschung und -anwendungen. Von mehreren KI-Unternehmen verifiziert: Es hilft Modellen, eine herausragende Leistung angesichts der Vielfalt der realen Welt zu erzielen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zur Privatsphäre, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datensammlung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.

Amerikanisches Englisch-Sprachdatensatz Mehrstrom-Sprachdatensatz Full-Duplex-Dialogdatensatz Spontansprechdatensatz Smartphone-Sprachdaten Mehrkanal-Audiodatensatz Trainingsdaten für Spracherkennung Dialog-KI-Datensatz

Spanisch (Mexiko) Datensatz mit realen Alltagsgesprächen und Monologen

Mexikanische spanische gesprochene Sprachdaten, die Inhalte aus allgemeinen Bereichen wie Dialoge, Medieninhalte und Unterhaltungsvideos abdecken und reale Kommunikationssituationen widerspiegeln. Dieses Datenset ist mit verschiedenen Attributen wie Textinhalt, Sprecheridentität und Geschlecht gekennzeichnet, weist eine hohe Genauigkeit und Benutzerfreundlichkeit auf und bietet reichhaltige Ressourcen für Forschungen und Anwendungen im Bereich Spracherkennung, um Modelle in der Vielfalt der realen Welt leistungsfähig zu machen. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um die Privatsphäre und rechtlichen Rechte der Benutzer während der Datenerfassung, -speicherung und -nutzung zu schützen. Alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.

Mexiko Spanisch Alltägliche Unterhaltung ASR

460 Stunden-Schwedisch (Schweden) Real-world Casual Conversation and Monologue Sprachdatensatz

Schwedische Sprachdaten_spoken. Spiegelt reale Interaktionskontexte wider. Dieser Datensatz ist mit einer Vielzahl von Attributen wie Textinhalt, Sprecheridentität, Geschlecht usw. versehen. Er wurde von schwedischen Muttersprachlern mit unterschiedlichem geografischem und kulturellem Hintergrund aufgenommen und zeichnet sich durch hohe Genauigkeit und Benutzerfreundlichkeit aus, was eine reichhaltige Ressource für Forschung und Anwendungen im Bereich der Spracherkennung darstellt und dem Modell hilft, angesichts der Vielfalt der realen Welt gute Leistungen zu erbringen. Wir halten uns streng an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die Rechte der Nutzer bei der Datenerfassung, -speicherung und -verwendung gewahrt bleiben und dass alle Daten mit GDPR, CCPA und PIPL konform sind.

Schwedisch spontan asr

1,100 Stunden gesammelte Sprachdaten natürlicher Dialoge auf Tagalog per Handy

Mehrkanal-Sprachdatensatz Voll-Duplex-Dialogdatensatz Mehrkanal-Audiodatensatz Trainingsdaten für Spracherkennung Mehrkanal-Stimmendatensatz

Projekt-Reifegrad

Mehrkanal-Sprachdatensatz

Voll-Duplex-Dialogdatensatz

Mehrkanal-Audiodatensatz

Trainingsdaten für Spracherkennung

Mehrkanal-Stimmendatensatz