en

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

Hochwertige Trainingsdatensätze

Steigern Sie die Leistung Ihrer KI-Modelle mit unseren hochwertigen, sofort einsetzbaren Trainingsdatensätzen.

Sprache

Alle

Datentyp

Alle

4 Personen - Chinesisches Hochexpressives Erzählungs-Durchschnittston-Sprachsynthesekorpus

Durchschnittliche Stimmfarbensynthesebibliothek mit hoher Ausdruckskraft von 4 chinesischen Sprechern, aufgenommen von professionellen Synchronsprechern. Für vorgegebene Bücher lesen die Sprecher im Stil von ausdrucksstarken Erzählungen vor.
Hohe Ausdruckskraft Erzählung TTS Chinesisch

5 Personen – Mehrstiliger und mehr emotionaler durchschnittlicher Sprachsynthese-Korpus

Eine Synthesebibliothek mit durchschnittlicher Stimmfarbe von 5 Personen, die verschiedene Stile und Emotionen abdeckt, gesammelt von professionellen Synchronsprechern. Die Stile umfassen die zielstrebige Chefin, den großzügigen Prinzen, die flinke Dienstmagd und die gutherzige Großmutter; die Emotionen umfassen Verachtung, Wut, Freude, Besorgnis, Überraschung, ängstliches Keuchen, kaltes Schnauben (Verachtung), Mitgefühl, Lachen, innere Gedanken, Ernst, Abneigung, Zweifel und Neutralität.
Synthetisches Korpus TTS Mandarin Chinesisch Multi-Stil Multi-Emotion

288 Millionen 3D-Modelle und Szenendaten

288 Millionen 3D-Modell- und Szenendatensätze, einschließlich 270 Millionen 3D-Modelle und 18 Millionen 3D-Szenen, wobei die 3D-Modelle verschiedene Typen wie Standardmodelle, Interaktionsmodelle und physikalisch erweiterte Modelle sowie verschiedene Objekte in Innenmöbelumgebungen abdecken. Die 3D-Szenen umfassen Innenraumgestaltung und kommerzielle Raumgestaltung. Dieser Datensatz kann für Aufgaben wie die Erstellung von 3D-Assets und den Aufbau von Simulationsumgebungen verwendet werden.
3D-Modell-Datensatz 3D-Szenen-Datensatz Indoor-3D-Umgebungsdatensatz kommerzieller 3D-Raum-Datensatz physikverbesserte 3D-Modelle interaktiver 3D-Modell-Datensatz 3D-Asset-Generierungsdatensatz Simulations-Trainingsumgebungsdatensatz virtuelle 3D-Umgebungsdaten großangelegter 3D-KI-Datensatz

Interspeech 2025-MLC-SLM Mehrsprachiges Dialog-Sprachwettbewerbsdatensatz

Der Hintergrund des Interspeech2025-MLC-SLM Multilingual Conversation Speech Challenge-Datensatzes ist, dass DataTang im Jahr 2025 den MLC-SLM Multilingual Conversation Speech Challenge veranstaltet hat. Der Datensatz stammt aus fünfzehn firmeneigenen Gesprächs-Sprachdatensätzen von DataTang. Die Daten sind hochpräzise, benutzerfreundlich und speziell darauf ausgelegt, die technischen Engpässe bei der mehrsprachigen Spracherkennung und dem Verständnis längerer Kontexte zu überwinden. Sie erfassen realistische komplexe Interaktionsszenarien wie Sprecherüberlagerungen und spontane Unterbrechungen und bieten reichhaltige Ressourcen für die Forschung und Anwendung im Bereich der Spracherkennung, sodass Modelle in der Lage sind, in realen, vielfältigen Szenarien hervorragende Leistungen zu zeigen. Wir halten streng die Datenschutzgesetze und -bestimmungen ein, um die Privatsphäre und die rechtlichen Interessen der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Vorschriften von GDPR, CCPA und PIPL.
Workshop-Audiodatensatz MLC-SLM-Datensatz ASR-Spracherkennungsdaten

3,000 Stunden voll-duplex Mandarin natürliche Gesprächs-Sprachdaten

Vollduplex-Putonghua-Natural-Conversation-Sprachdaten, aufgenommen basierend auf häufigen Gesprächsthemen. Dieser Datensatz ist mit Textinhalten, Satzzeitstempel, Sprecheridentität, Geschlecht und anderen Eigenschaften annotiert und bietet eine hohe Genauigkeit. Er stellt eine wertvolle Ressource für Forschung und Anwendungen im Bereich der Spracherkennung dar und wurde von mehreren KI-Unternehmen verifiziert: Dies hilft Modellen, in der realen Welt mit ihrer Vielfalt hervorragende Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um sicherzustellen, dass die Privatsphäre und die rechtlichen Rechte der Benutzer während der Datenerfassung, -speicherung und -nutzung gewahrt bleiben. Alle Daten entsprechen den Vorgaben von GDPR, CCPA und PIPL.
Vollduplex Dialog Mandarin

119 Stunden griechische Sprachaufnahmen für mobile Datenerfassung und Vorlesen

Griechische Sprachdaten_Audioaufnahme (Handy), basierend auf einem vorgegebenen Skript vorgelesen und simuliert aufgenommen. Es gibt insgesamt 95 Sprecherinnen und Sprecher aus Griechenland. Die Aufnahmeumgebung erfolgte in einer ruhigen, hallfreien Umgebung. Der Aufnahmeinhalt ist breit gefächert, jede Person etwa 1,000 Sätze. Die Texte wurden manuell überprüft und weisen eine hohe Genauigkeit auf. Sie bieten reichhaltige Ressourcen für die Forschung und Anwendung im Bereich Spracherkennung und wurden von mehreren KI-Unternehmen validiert: Sie helfen Modellen, in der realen Welt mit Vielfalt exzellente Leistungen zu erzielen. Wir befolgen strikt die Datenschutzgesetze und Datenschutzbestimmungen, um die Privatsphäre und rechtlichen Interessen der Nutzer während der Datenerfassung, -speicherung und -nutzung zu schützen. Alle Daten entsprechen den Vorschriften der DSGVO, CCPA und PIPL.
Griechisches geskriptetes Monolog-Datenset Griechisches Sprach-Datenset Griechisches Audio-Datenset Griechische Sprachdaten Griechische Sprachsynthesedaten

280 Stunden norwegische Sprachaufnahmen für mobile Datenerfassung

Norwegische Sprachdaten_Audioaufnahme (Handy), basierend auf vorgegebenen Skripten vorgelesen und simuliert aufgenommen. Es gibt insgesamt 157 Sprecher, die alle aus Norwegen stammen. Die Aufnahmeumgebung wurden in einer ruhigen, hallfreien Umgebung durchgeführt. Der Aufnahmeinhalt ist umfangreich, jeder Sprecher etwa 1,000 Sätze. Die Texte wurden manuell überprüft und weisen eine hohe Genauigkeit auf, wodurch sie reichhaltige Ressourcen für die Forschung und Anwendung der Spracherkennung bieten. Mehrere KI-Unternehmen haben bestätigt: Dies hilft Modellen, in der Vielfalt der realen Welt hervorragende Leistungen zu erbringen. Wir halten strikt die Datenschutzgesetze und Vorschriften ein, um die Privatsphäre und die rechtlichen Rechte der Benutzer während der Datenerfassung, -speicherung und -nutzung zu schützen. Alle Daten entsprechen GDPR, CCPA und PIPL.
Norwegisches geskriptetes Monolog-Datensatz norwegisches Sprachdatensatz norwegische Sprachsynthesedaten norwegisches NLP-Korpus norwegische Sprachdaten norwegisches Audiodatensatz

500,000 Bilder von natürlichen Szenen in 21 Ländern & Dokumentaufnahmen & elektronische Szenen mit OCR-Anmerkungen

500,000 Bilder von 21 Ländern mit natürlichen Szenen, Dokumentenfotografie-Szenen und elektronischen Szenen für OCR-Kennzeichnung. Die Daten umfassen 21 Sprachen, wobei die Anzahl der Bilder pro Sprache zwischen 20,000 und 25,000 liegt. Die Datentypen umfassen natürliche Szenen, Dokumentenfotografie-Szenen und elektronische Szenen. Die Datenvielfalt beinhaltet verschiedene Datentypen, unterschiedliche Aufnahmewinkel und mehrere Sprachen. Für die Kennzeichnung werden Zeilen- (Spalten-) level Vier-Eck- oder Polygon-Kennzeichnungen sowie zeilen- (spalten-) level Inhaltsabschriften verwendet. Die Daten können für mehrsprachige OCR-Erkennungsaufgaben genutzt werden.
mehrsprachiges OCR-Datensatz Szenentexterkennungsdaten Dokument-OCR-Datensatz elektronische Bildschirmanzeigendaten OCR OCR-Datensatz in 21 Sprachen KI-OCR-Trainingsdaten Texterkennungsdatensatz

200,000 Satze von Bild-Text-Daten zu internationalen Wahrzeichengebäuden

200,000 Sätze von Bild-Text-Daten zu internationalen Wahrzeichengebäuden. Jeder Datensatz besteht aus einem Bild sowie einem Beschreibungsdokument auf Chinesisch und Englisch. Darin sind 80,000 Sätze zu chinesischen Wahrzeichen und 120,000 Sätze zu Wahrzeichen anderer Länder enthalten, mit einer Verteilung auf mindestens 20 Länder wie die Vereinigten Staaten, Großbritannien, Frankreich, Russland, Deutschland u. a. Pro Wahrzeichen liegen 1 bis 10 Bilder vor, die Informationen aus verschiedenen Perspektiven, Entfernungen und Zeitzonen vermitteln. Die Wahrzeichen umfassen verschiedene Typen von Gebäuden, wie Geschäftstürme, alte Bauten, Denkmäler, Bibliotheken, Sehenswürdigkeiten usw. Bei den Annotationen werden das Land des Wahrzeichens, die Stadt, der genaue Standort, die Kategorie sowie die Beschreibung des Wahrzeichens erfasst. Die Daten können für die Erkennung und Analyse von Wahrzeichengebäuden verwendet werden.
Wahrzeichen-Bilddatensatz Gebäudeerkennungsdatensatz Globaler Bild-Beschreibungsdatensatz für Wahrzeichen Bilinguale Bild-Beschreibungsdaten Chinesisch-englischer Beschreibungsdatensatz Wahrzeichen-Klassifikationsdatensatz Bild-Text-Datensatz Touristische Wahrzeichen-Datensatz Kulturerbestands-Bilddatensatz Image Bildbeschriftung für die KI-Training

600 Stunden gesprochene Griechisch-Daten

Griechische gesprochene Sprachdaten, deren Inhalt allgemeine Bereiche wie soziale Medien, Gespräche und Livestreams abdeckt und echte Interaktionssituationen widerspiegelt. Dieser Datensatz ist mit mehreren Attributen wie Textinhalt und Geschlecht des Sprechers annotiert und wurde von mehreren Rumänen aus verschiedenen Regionen und kulturellen Hintergründen aufgenommen. Er zeichnet sich durch hohe Genauigkeit und Benutzerfreundlichkeit aus und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung, wodurch die Modelle in der Lage sind, in realen, vielfältigen Szenarien hervorragende Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um die Privatsphäre und die rechtlichen Rechte der Benutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Bestimmungen von GDPR, CCPA und PIPL.
griechisches Sprachdatensatz griechische ASR-Trainingsdaten griechisches Konversationskorpus griechische Monologsprache griechisches Spracherkennungsdatensatz Sprache-zu-Text griechische Daten griechisches Sprachdatensatz griechisches Transkriptionsdatensatz

600 Stunden gesprochene norwegische Sprachdaten

Norwegische gesprochene Sprachdaten, deren Inhalt allgemein Bereiche wie Social Media, Dialoge und Livestream abdeckt, spiegeln echte Interaktionssituationen wider. Dieses Datenset enthält Anmerkungen zu Textinhalten, Geschlecht der Sprecher und weiteren Eigenschaften und wurde von mehreren Rumänen aus unterschiedlichen Regionen und Kulturen aufgenommen. Es zeichnet sich durch hohe Genauigkeit und einfache Handhabung aus und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung, wodurch Modelle in der Lage sind, eine herausragende Leistung in der Vielfalt der echten Welt zu zeigen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zum Schutz der Privatsphäre, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten; alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.
norwegisches Sprachdatensatz norwegische ASR-Trainingsdaten norwegisches Gesprächskorpus norwegische Monologsprache norwegisches Spracherkennungsdatensatz Sprach-zu-Text norwegische Daten norwegisches Sprachdatensatz mehrsprachige Sprachdaten norwegisches Transkriptionsdatensatz

Hochauflösender Synthesedatensatz für 3D-Szenen_Cockpit

Hochrealistischer 3D-Szenen-Synthesedatensatz_Cockpit: Sensordaten, die durch 3D-Szenenmodellierung erstellt wurden und der realen Welt stark ähneln, einschließlich Kameraaufnahmen, Videosequenzen und Punktwolken. Verfügbare Annotationen beinhalten, sind aber nicht beschränkt auf Kameraparameter, Zielkategorie/Erkennung/Semantische Segmentierung, Zeit-/Licht-/Wetter-Metadaten sowie Körperposen wie Kopf-/Augen-/Arm-/Beinposition und -richtung. Dieser Datensatz kann für Umweltmodellierung und Datensynthese in Anwendungsbereichen wie autonomem Fahren und Robotik verwendet werden.
3D-Synthetikdaten Fahrerüberwachungs-Synthetikdatensatz autonome Fahr-Synthetikdaten hochpräziser Simulationsdatensatz synthetische Punktwolkendaten Kamera-Simulationsdatensatz synthetischer Mensch-Pose-Datensatz synthetischer Lidar-Datensatz 3D-Umgebungsmodellierung Robotik-Synthetikdaten DMS-Datensatz
. . .
loading

loading

133ea62a-2e34-4887-a474-716b39691aa0