3,000 Stunden voll-duplex Mandarin natürliche Gesprächs-Sprachdaten

Vollduplex

Dialog

Mandarin

Vollduplex-Putonghua-Natural-Conversation-Sprachdaten, aufgenommen basierend auf häufigen Gesprächsthemen. Dieser Datensatz ist mit Textinhalten, Satzzeitstempel, Sprecheridentität, Geschlecht und anderen Eigenschaften annotiert und bietet eine hohe Genauigkeit. Er stellt eine wertvolle Ressource für Forschung und Anwendungen im Bereich der Spracherkennung dar und wurde von mehreren KI-Unternehmen verifiziert: Dies hilft Modellen, in der realen Welt mit ihrer Vielfalt hervorragende Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um sicherzustellen, dass die Privatsphäre und die rechtlichen Rechte der Benutzer während der Datenerfassung, -speicherung und -nutzung gewahrt bleiben. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.

Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.

Spezifikationen

Format

Mikrofon - 48kHz, 16bit, unkomprimiertes WAV, Mono; Handy - 24kHz, 16bit, unkomprimiertes WAV, Mono

Aufnahmeumgebung

relativ ruhiger Innenraum, ohne Echo;

Aufnahmeinhalt

Es wird eine Themenliste bereitgestellt, aus der die Sprecher mehrere ihnen vertraute Themen auswählen, um einen flüssigen und natürlichen Dialog zu gewährleisten. Rund jedes Thema wird ein Dialogabschnitt aufgenommen.

Teilnehmer

etwa 3,600 Sprecher, ausgewogenes Geschlechterverhältnis, Abdeckung mehrerer Altersgruppen

Kennzeichnungsmerkmale

Annotierter Textinhalt, Mandarin-Interpretation, Start- und Endzeitpunkte gültiger Sätze, Sprecherkennung

Geräte

Soundkarte + hochwertiges HiFi-Mikrofon / Smartphone

Sprache

Mandarin-Chinesisch

Genauigkeit

Zeichengenauigkeit 99%

Anwendungsbereich

Spracherkennung, Stimmabdruckerkennung

Empfohlener Datensatz

Interspeech 2025-MLC-SLM Mehrsprachiges Dialog-Sprachwettbewerbsdatensatz

Der Hintergrund des Interspeech2025-MLC-SLM Multilingual Conversation Speech Challenge-Datensatzes ist, dass DataTang im Jahr 2025 den MLC-SLM Multilingual Conversation Speech Challenge veranstaltet hat. Der Datensatz stammt aus fünfzehn firmeneigenen Gesprächs-Sprachdatensätzen von DataTang. Die Daten sind hochpräzise, benutzerfreundlich und speziell darauf ausgelegt, die technischen Engpässe bei der mehrsprachigen Spracherkennung und dem Verständnis längerer Kontexte zu überwinden. Sie erfassen realistische komplexe Interaktionsszenarien wie Sprecherüberlagerungen und spontane Unterbrechungen und bieten reichhaltige Ressourcen für die Forschung und Anwendung im Bereich der Spracherkennung, sodass Modelle in der Lage sind, in realen, vielfältigen Szenarien hervorragende Leistungen zu zeigen. Wir halten streng die Datenschutzgesetze und -bestimmungen ein, um die Privatsphäre und die rechtlichen Interessen der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Vorschriften von GDPR, CCPA und PIPL.

Workshop-Audiodatensatz MLC-SLM-Datensatz ASR-Spracherkennungsdaten

581 Stunden gesprochene Griechisch-Daten

Griechische gesprochene Sprachdaten, deren Inhalt allgemeine Bereiche wie soziale Medien, Gespräche und Livestreams abdeckt und echte Interaktionssituationen widerspiegelt. Dieser Datensatz ist mit mehreren Attributen wie Textinhalt und Geschlecht des Sprechers annotiert und wurde von mehreren Rumänen aus verschiedenen Regionen und kulturellen Hintergründen aufgenommen. Er zeichnet sich durch hohe Genauigkeit und Benutzerfreundlichkeit aus und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung, wodurch die Modelle in der Lage sind, in realen, vielfältigen Szenarien hervorragende Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um die Privatsphäre und die rechtlichen Rechte der Benutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Bestimmungen von GDPR, CCPA und PIPL.

griechisches Sprachdatensatz griechische ASR-Trainingsdaten griechisches Konversationskorpus griechische Monologsprache griechisches Spracherkennungsdatensatz Sprache-zu-Text griechische Daten griechisches Sprachdatensatz griechisches Transkriptionsdatensatz

600 Stunden gesprochene norwegische Sprachdaten

Norwegische gesprochene Sprachdaten, deren Inhalt allgemein Bereiche wie Social Media, Dialoge und Livestream abdeckt, spiegeln echte Interaktionssituationen wider. Dieses Datenset enthält Anmerkungen zu Textinhalten, Geschlecht der Sprecher und weiteren Eigenschaften und wurde von mehreren Rumänen aus unterschiedlichen Regionen und Kulturen aufgenommen. Es zeichnet sich durch hohe Genauigkeit und einfache Handhabung aus und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung, wodurch Modelle in der Lage sind, eine herausragende Leistung in der Vielfalt der echten Welt zu zeigen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zum Schutz der Privatsphäre, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten; alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.

norwegisches Sprachdatensatz norwegische ASR-Trainingsdaten norwegisches Gesprächskorpus norwegische Monologsprache norwegisches Spracherkennungsdatensatz Sprach-zu-Text norwegische Daten norwegisches Sprachdatensatz mehrsprachige Sprachdaten norwegisches Transkriptionsdatensatz

Gesprächs-Sprachdaten im Gujarati-Skript

Gujarati-Skript-Dialog-Sprachdaten, basierend auf vorgegebenen Skripten simulierte Dialoge und Aufnahmen, die mehrere Bereiche abdecken und reichhaltige Inhalte bieten. Dieses Datenset kennzeichnet verschiedene Attribute wie Textinhalt, ist hochpräzise und bietet wertvolle Ressourcen für Forschung und Anwendungen im Bereich Spracherkennung. Dies wurde von mehreren KI-Unternehmen überprüft: Es hilft Modellen, in der Vielfalt der realen Welt hervorragende Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zum Schutz der Privatsphäre, um sicherzustellen, dass die Erfassung, Speicherung und Nutzung der Daten die Privatsphäre und rechtlichen Interessen der Nutzer wahrt. Alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.

Gujarati-Audiodatensatz Gujarati-ASR-Datensatz Gujarati-Sprachdatensatz Gujarati-TTS-Datensatz

600 Stunden philippinisches Englisch, getrennte Spuren, natürliche Dialoge, Smartphone-erfasste Sprachdaten

Philippinisches Englisch-Sprachdatenset für natürliche Konversationen, gesammelt über Mobilgeräte, nach häufigen Themen für simulierte Aufnahmen. Dieses Datenset enthält Annotationen zu Textinhalt, Satzzeitstempel, Sprecheridentität, Geschlecht und weiteren Eigenschaften. Es wurde von philippinischen Muttersprachlern aus verschiedenen Regionen und kulturellem Hintergrund aufgenommen, mit hoher Genauigkeit, und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich Spracherkennung. Es wurde von mehreren KI-Unternehmen überprüft: Es hilft Modellen, in der Vielfalt der echten Welt hervorragende Leistungen zu erzielen. Wir halten uns strikt an Datenschutzgesetze und Privatsphärenbestimmungen, um die Privatsphäre und die rechtlichen Rechte der Nutzer während der Datensammlung, -speicherung und -nutzung zu wahren. Alle Daten entsprechen den Vorschriften von GDPR, CCPA und PIPL.

Dialog-KI-Datensatz Spracherkennungs-Trainingsdaten Mehrkanal-Audiodatensatz Smartphone-Sprachdaten spontaner Sprachdatensatz Mehrstrom-Sprachdatensatz Philippinisch-Englischer Sprachdatensatz Vollduplex-Sprachdatensatz

600 Stunden amerikanisches Englisch, separate Spuren, natürliche Dialoge, per Mobiltelefon gesammelte Sprachdaten

Amerikanisches Englisch, getrennte Spuren für natürliche Konversation, Sprachaufnahmen werden über Handys gesammelt und basieren auf häufigen Themen zur simulierten Aufnahme. Dieses Datenset annotiert Textinhalte, Satzzeitstempel, Sprecheridentität, Geschlecht und weitere Eigenschaften und wurde von US-amerikanischen Muttersprachlern aus unterschiedlichen Regionen und Kulturen aufgenommen. Es ist hochpräzise und bietet reichhaltige Ressourcen für sprachbasierte Erkennungsforschung und -anwendungen. Von mehreren KI-Unternehmen verifiziert: Es hilft Modellen, eine herausragende Leistung angesichts der Vielfalt der realen Welt zu erzielen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zur Privatsphäre, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datensammlung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.

Amerikanisches Englisch-Sprachdatensatz Mehrstrom-Sprachdatensatz Full-Duplex-Dialogdatensatz Spontansprechdatensatz Smartphone-Sprachdaten Mehrkanal-Audiodatensatz Trainingsdaten für Spracherkennung Dialog-KI-Datensatz

500 Stunden natürliche Gespräche auf Jinan-Dialekt (zweisprachig annotiert), Sprachdaten mit dem Handy gesammelt

Jinan-Dialekt-Sprachdaten_Gespräche (Handy), aufgezeichnet durch Freisprechgespräche der Sprecher. Dieser Datensatz enthält verschiedene Attribute wie Textinhalte, Satzzeitstempel, Sprecheridentität und Geschlecht. Die Aufnahmen wurden von Muttersprachlern des Dialekts gemacht, wodurch eine hohe Genauigkeit gewährleistet ist. Er bietet reichhaltige Ressourcen für Spracherkennungsforschung und -anwendungen und wurde von mehreren KI-Unternehmen validiert: Er hilft Modellen, in der realen Welt mit deren Vielfalt hervorragend zu funktionieren. Wir halten uns strikt an Datenschutzgesetze und Datenschutzbestimmungen, um bei der Erhebung, Speicherung und Nutzung der Daten die Privatsphäre und die gesetzlichen Rechte der Nutzer zu wahren. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.

Dialekt Gespräch

Spanisch (Mexiko) Datensatz mit realen Alltagsgesprächen und Monologen

Mexikanische spanische gesprochene Sprachdaten, die Inhalte aus allgemeinen Bereichen wie Dialoge, Medieninhalte und Unterhaltungsvideos abdecken und reale Kommunikationssituationen widerspiegeln. Dieses Datenset ist mit verschiedenen Attributen wie Textinhalt, Sprecheridentität und Geschlecht gekennzeichnet, weist eine hohe Genauigkeit und Benutzerfreundlichkeit auf und bietet reichhaltige Ressourcen für Forschungen und Anwendungen im Bereich Spracherkennung, um Modelle in der Vielfalt der realen Welt leistungsfähig zu machen. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um die Privatsphäre und rechtlichen Rechte der Benutzer während der Datenerfassung, -speicherung und -nutzung zu schützen. Alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.

Mexiko Spanisch Alltägliche Unterhaltung ASR

3,000 Stunden voll-duplex Mandarin natürliche Gesprächs-Sprachdaten

Vollduplex Dialog Mandarin

Projekt-Reifegrad

Vollduplex

Dialog

Mandarin