en

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

Spracherkennungsdatensätze

Verbessern Sie sofort die Leistung von KI-Modellen mit hochwertigen Standarddatensätzen.

Sprache

Alle
201
Arabisch
2
Birmanisch
2
Chinesischer Dialekt
9
Englisch
43
Französisch
10
Deutsch
8
Hindi
6
Indonesisch
8
Italienisch
7
Japanisch
6
Koreanisch
12
Malaiisch
5
Mandarin
8
Andere
38
Portugiesisch
11
Russisch
5
Spanisch
12
Thailändisch
7
Vietnamesisch
5

Datentyp

Alle
201
Dialog
96
Lesen
106

200 Stunden Koreanisches Voll-Duplex Mehrkanal-Sprachdatenset

Voll-duplex koreanische natürliche Gesprächs-Sprachdaten, die über Mobiltelefone gesammelt wurden, basierend auf gängigen Themen simuliert aufgezeichnet. Dieses Datenset enthält Annotationen zu Textinhalt, Satzzeitstempel, Sprecheridentität, Geschlecht und weiteren Eigenschaften. Es wurde von koreanischen Muttersprachlern aus verschiedenen Regionen und kulturellen Hintergründen aufgenommen, ist hochpräzise und bietet reichhaltige Ressourcen für die Forschung und Anwendungen der Spracherkennung. Mehrere KI-Unternehmen haben bestätigt, dass es dazu beiträgt, dass Modelle in der realen Welt vielseitig und leistungsstark agieren können. Wir halten strikt die Datenschutzgesetze und Vorschriften zum Schutz der Privatsphäre ein, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datensammlung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.
Korean-Sprachdatensatz spontanes koreanisches Dialog Multistream-Audiodatensatz konversationelles koreanisches Sprachmaterial auf dem Smartphone aufgenommenes Audio Dual-Speaker-Datensatz realistische koreanische Gespräche Full-Duplex-Sprachdatensatz

351 Personen-Deutsch(Deutschland) Skripted Monologue speech dataset_Guiding (Handy)

Deutsche Sprachdaten (Handy), basierend auf einem vorgegebenen Skript, das vorgelesen und simuliert aufgezeichnet wurde, deckt verschiedene Bereiche ab, darunter Fahrzeugszenarien, Smart Home und Sprachassistenten, und ist inhaltlich reichhaltig. Dieser Datensatz ist mit verschiedenen Attributen wie Textinhalt und Zeitstempel versehen und wurde von 351 Muttersprachlern mit hoher Genauigkeit aufgenommen. Er bietet eine reichhaltige Quelle für Forschungen und Anwendungen im Bereich der Spracherkennung und wurde von mehreren KI-Unternehmen getestet: Er trägt dazu bei, dass Modelle angesichts der Vielfalt der realen Welt hervorragende Leistungen erbringen können. Wir halten uns strikt an die Datenschutzbestimmungen und -vorschriften, um die Privatsphäre und die legitimen Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung zu schützen. Alle Daten entsprechen den Bestimmungen der DSGVO, des CCPA und des PIPL.
Deutsche Sprachdaten deutsche Sprachdaten deutsche Schriftsprachdaten

161 Stunden-Gujarati Scripted Monologue Sprachdatensatz

Gujarati Vorlese-Sprachdaten mit Inhalten, die generische Bereiche abdecken und reale Sprachkontexte widerspiegeln. Dieser Datensatz ist mit Textinhalten annotiert, die sich durch hohe Genauigkeit und Benutzerfreundlichkeit auszeichnen. Dies stellt eine reichhaltige Ressource für Forschung und Anwendungen im Bereich der Spracherkennung dar und hilft dem Modell, angesichts der Vielfalt der realen Welt gut abzuschneiden. Wir halten uns strikt an die Datenschutzbestimmungen und die Regeln zum Schutz der Privatsphäre, um sicherzustellen, dass die Privatsphäre und die Rechte der Nutzer bei der Datenerfassung, -speicherung und -verwendung gewahrt bleiben und alle Daten mit GDPR, CCPA und PIPL übereinstimmen.
Gujarati Lesung Skripted Monologue

800 Stunden - Konversation im Kunming-Dialekt (zweisprachig annotierte) Sprachdaten per Handy

Sprachdatensatz des Kunming-Dialekts_Audio-Dialoge (Handy), aufgenommen durch freie Gespräche der Sprecher. Dieser Datensatz enthält verschiedene Attribute wie Textinhalte, Satzzeitstempel, Sprecheridentität und Geschlecht. Die Aufnahmen wurden von Muttersprachlern des Dialekts gemacht, wodurch eine hohe Genauigkeit gewährleistet ist. Er bietet reichhaltige Ressourcen für Sprach­erkennungsforschung und -anwendungen und wurde von mehreren KI-Unternehmen validiert: Er hilft Modellen, in der realen Welt mit deren Vielfalt hervorragend zu funktionieren. Wir halten uns strikt an Datenschutzgesetze und Datenschutzbestimmungen, um bei der Erhebung, Speicherung und Nutzung der Daten den Schutz der Privatsphäre und die rechtlichen Rechte der Nutzer zu gewährleisten. Alle Daten unterliegen den Bestimmungen von GDPR, CCPA und PIPL.
ast

500 Stunden – Wuhan-Dialekt Konversation (zweisprachig annotierte) Sprachdaten per Handy

Wuhan-Dialekt-Sprachdaten_Dialoge (Handy), aufgezeichnet durch freie Gespräche der Sprecher. Dieser Datensatz enthält Annotationen zu Textinhalten, Satzzeitstempel, Sprecheridentität, Geschlecht und weiteren Eigenschaften. Er wurde von muttersprachlichen Dialektsprechern aufgenommen und ist hochpräzise, wodurch er umfangreiche Ressourcen für Forschungen und Anwendungen im Bereich Spracherkennung bietet. Mehrere AI-Unternehmen haben die Daten überprüft: Sie tragen dazu bei, dass Modelle in der realen Welt mit Vielfalt hervorragend performen können. Wir halten uns strikt an Datenschutzgesetze und -bestimmungen, um die Privatsphäre und rechtlichen Interessen der Nutzer während der Datenerhebung, -speicherung und -nutzung zu schützen. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.
Wuhan Dialekt Gespräch

500 Stunden - Guilin-Dialektgespräche (zweisprachig annotierte) Sprachdaten per Handy

Guilin-Dialekt-Sprachdaten_Dialog (Handy), aufgezeichnet durch Freigespräche der Sprecher. Dieser Datensatz enthält Markierungen zu Textinhalt, Satzzeitstempel, Sprecheridentität, Geschlecht und weiteren Eigenschaften. Er wurde von Muttersprachlern des Dialekts aufgenommen, besitzt hohe Genauigkeit und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich Spracherkennung. Mehrere AI-Unternehmen haben die Daten überprüft: Sie tragen dazu bei, dass Modelle in der realen Welt mit Vielfalt hervorragend performen können. Wir halten uns streng an Datenschutzgesetze und -bestimmungen, um während der Datenerhebung, -speicherung und -nutzung den Schutz der Privatsphäre und die rechtlichen Rechte der Nutzer zu gewährleisten. Alle Daten unterliegen den Bestimmungen der GDPR, CCPA, PIPL.
ast Dialekt Guilin

500 Stunden – Liuzhou-Dialekt-Gespräch (zweisprachig annotierte) Sprachdaten per Handy

Liuzhou-Dialekt-Sprachdaten_Dialogue (Handy), aufgezeichnet durch freie Gespräche der Sprecher. Dieser Datensatz enthält verschiedene Kennzeichnungen wie Textinhalt, Satzzeitstempel, Sprecheridentität, Geschlecht usw. Er wurde von muttersprachlichen Dialektsprechern aufgenommen und ist hochpräzise. Er bietet umfangreiche Ressourcen für Forschungen und Anwendungen im Bereich Spracherkennung und wurde von mehreren AI-Unternehmen überprüft: Er hilft Modellen, in realen, vielfältigen Szenarien hervorragende Leistungen zu erbringen. Wir halten streng die Datenschutzgesetze und -vorschriften ein, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datenerhebung, -speicherung und -nutzung zu schützen. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.
Dialekt Liuzhou Guangxi Gespräch

800 Hours - Lanzhou Dialect Conversation (Bilingual Annotated) Speech Data by Handys

Lanzhou-Dialekt-Sprachdaten_Dialogue (Handy), aufgezeichnet durch freie Gespräche der Sprecher. Dieser Datensatz enthält verschiedene Kennzeichnungen wie Textinhalt, Satzzeitstempel, Sprecheridentität, Geschlecht usw. Er wurde von muttersprachlichen Dialektsprechern aufgenommen und ist hochpräzise. Er bietet umfangreiche Ressourcen für Forschungen und Anwendungen im Bereich Spracherkennung und wurde von mehreren AI-Unternehmen überprüft: Er hilft Modellen, in realen, vielfältigen Szenarien hervorragende Leistungen zu erbringen. Wir halten streng die Datenschutzgesetze und -vorschriften ein, um die Privatsphäre und rechtlichen Interessen der Nutzer während der Datenerhebung, -speicherung und -nutzung zu schützen. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.
AST Dialekt Gespräch

200 Stunden-English Gaming Real-world Casual Conversation and Monologue Sprachdatensatz

Speech data_spoken in der englischen Gaming-Domäne wurde aus der Konversation in den populärsten und immergrünen Head-Games des Landes ausgewählt und deckt die Verhandlungen der Spieler über Kampfstrategien, soziale Interaktionen, spielähnliche Nachrichten usw. ab, die den realen Interaktionskontext widerspiegeln. Dieser Datensatz ist mit einer Vielzahl von Attributen versehen, wie z. B. Textinhalt, Identität und Geschlecht des Sprechers, Anmerkungen zu beleidigenden Äußerungen usw. Er wurde von einer Reihe von Personen mit unterschiedlichem geografischem und kulturellem Hintergrund aufgezeichnet, ist äußerst genau und einfach zu verwenden und stellt eine reichhaltige Ressource für Forschung und Anwendungen im Bereich Spracherkennung dar. Wir halten uns strikt an die Datenschutzbestimmungen und die Regeln zum Schutz der Privatsphäre, um sicherzustellen, dass die Privatsphäre und die Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung gewahrt bleiben, und zwar in Übereinstimmung mit GDPR, CCPA und PIPL.
Englisch Spontaner Dialog Spiele
. . .

loading

Passen Sie Ihre Daten jetzt an

Warum Standarddatensätze

  • Urheberrecht

    Urheberrecht

    Klares Copyright und Bereit zur Kontrolle
  • Sicherheit

    Sicherheit

    Ordnungsgemäß autorisiert
  • Professionell

    Professionell

    Entworfen und hergestellt
  • Vielfalt

    Vielfalt

    Gesammelt aus einer Vielzahl von von realen Szenen
  • Kosteneffizient

    Kosteneffizient

    Kosteneffizienter
  • Effizienz

    Effizienz

    Sofortige Lieferung in Sekundenschnelle
0c1cd436-d2e6-4125-9dd5-53471f73bb71