de

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

Hochwertige Trainingsdatensätze

Steigern Sie die Leistung Ihrer KI-Modelle mit unseren hochwertigen, sofort einsetzbaren Trainingsdatensätzen.

Sprache

Alle

Datentyp

Alle

288 Millionen 3D-Modelle und Szenendaten

288 Millionen 3D-Modell- und Szenendatensätze, einschließlich 270 Millionen 3D-Modelle und 18 Millionen 3D-Szenen, wobei die 3D-Modelle verschiedene Typen wie Standardmodelle, Interaktionsmodelle und physikalisch erweiterte Modelle sowie verschiedene Objekte in Innenmöbelumgebungen abdecken. Die 3D-Szenen umfassen Innenraumgestaltung und kommerzielle Raumgestaltung. Dieser Datensatz kann für Aufgaben wie die Erstellung von 3D-Assets und den Aufbau von Simulationsumgebungen verwendet werden.
3D-Modell-Datensatz 3D-Szenen-Datensatz Indoor-3D-Umgebungsdatensatz kommerzieller 3D-Raum-Datensatz physikverbesserte 3D-Modelle interaktiver 3D-Modell-Datensatz 3D-Asset-Generierungsdatensatz Simulations-Trainingsumgebungsdatensatz virtuelle 3D-Umgebungsdaten großangelegter 3D-KI-Datensatz

Interspeech 2025-MLC-SLM Mehrsprachiges Dialog-Sprachwettbewerbsdatensatz

Der Hintergrund des Interspeech2025-MLC-SLM Multilingual Conversation Speech Challenge-Datensatzes ist, dass DataTang im Jahr 2025 den MLC-SLM Multilingual Conversation Speech Challenge veranstaltet hat. Der Datensatz stammt aus fünfzehn firmeneigenen Gesprächs-Sprachdatensätzen von DataTang. Die Daten sind hochpräzise, benutzerfreundlich und speziell darauf ausgelegt, die technischen Engpässe bei der mehrsprachigen Spracherkennung und dem Verständnis längerer Kontexte zu überwinden. Sie erfassen realistische komplexe Interaktionsszenarien wie Sprecherüberlagerungen und spontane Unterbrechungen und bieten reichhaltige Ressourcen für die Forschung und Anwendung im Bereich der Spracherkennung, sodass Modelle in der Lage sind, in realen, vielfältigen Szenarien hervorragende Leistungen zu zeigen. Wir halten streng die Datenschutzgesetze und -bestimmungen ein, um die Privatsphäre und die rechtlichen Interessen der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Vorschriften von GDPR, CCPA und PIPL.
Workshop-Audiodatensatz MLC-SLM-Datensatz ASR-Spracherkennungsdaten

119 Stunden griechische Sprachaufnahmen für mobile Datenerfassung und Vorlesen

Griechische Sprachdaten_Audioaufnahme (Handy), basierend auf einem vorgegebenen Skript vorgelesen und simuliert aufgenommen. Es gibt insgesamt 95 Sprecherinnen und Sprecher aus Griechenland. Die Aufnahmeumgebung erfolgte in einer ruhigen, hallfreien Umgebung. Der Aufnahmeinhalt ist breit gefächert, jede Person etwa 1,000 Sätze. Die Texte wurden manuell überprüft und weisen eine hohe Genauigkeit auf. Sie bieten reichhaltige Ressourcen für die Forschung und Anwendung im Bereich Spracherkennung und wurden von mehreren KI-Unternehmen validiert: Sie helfen Modellen, in der realen Welt mit Vielfalt exzellente Leistungen zu erzielen. Wir befolgen strikt die Datenschutzgesetze und Datenschutzbestimmungen, um die Privatsphäre und rechtlichen Interessen der Nutzer während der Datenerfassung, -speicherung und -nutzung zu schützen. Alle Daten entsprechen den Vorschriften der DSGVO, CCPA und PIPL.
Griechisches geskriptetes Monolog-Datenset Griechisches Sprach-Datenset Griechisches Audio-Datenset Griechische Sprachdaten Griechische Sprachsynthesedaten

280 Stunden norwegische Sprachaufnahmen für mobile Datenerfassung

Norwegische Sprachdaten_Audioaufnahme (Handy), basierend auf vorgegebenen Skripten vorgelesen und simuliert aufgenommen. Es gibt insgesamt 157 Sprecher, die alle aus Norwegen stammen. Die Aufnahmeumgebung wurden in einer ruhigen, hallfreien Umgebung durchgeführt. Der Aufnahmeinhalt ist umfangreich, jeder Sprecher etwa 1,000 Sätze. Die Texte wurden manuell überprüft und weisen eine hohe Genauigkeit auf, wodurch sie reichhaltige Ressourcen für die Forschung und Anwendung der Spracherkennung bieten. Mehrere KI-Unternehmen haben bestätigt: Dies hilft Modellen, in der Vielfalt der realen Welt hervorragende Leistungen zu erbringen. Wir halten strikt die Datenschutzgesetze und Vorschriften ein, um die Privatsphäre und die rechtlichen Rechte der Benutzer während der Datenerfassung, -speicherung und -nutzung zu schützen. Alle Daten entsprechen GDPR, CCPA und PIPL.
Norwegisches geskriptetes Monolog-Datensatz norwegisches Sprachdatensatz norwegische Sprachsynthesedaten norwegisches NLP-Korpus norwegische Sprachdaten norwegisches Audiodatensatz

500,000 Bilder von natürlichen Szenen in 21 Ländern & Dokumentaufnahmen & elektronische Szenen mit OCR-Anmerkungen

500,000 Bilder von 21 Ländern mit natürlichen Szenen, Dokumentenfotografie-Szenen und elektronischen Szenen für OCR-Kennzeichnung. Die Daten umfassen 21 Sprachen, wobei die Anzahl der Bilder pro Sprache zwischen 20,000 und 25,000 liegt. Die Datentypen umfassen natürliche Szenen, Dokumentenfotografie-Szenen und elektronische Szenen. Die Datenvielfalt beinhaltet verschiedene Datentypen, unterschiedliche Aufnahmewinkel und mehrere Sprachen. Für die Kennzeichnung werden Zeilen- (Spalten-) level Vier-Eck- oder Polygon-Kennzeichnungen sowie zeilen- (spalten-) level Inhaltsabschriften verwendet. Die Daten können für mehrsprachige OCR-Erkennungsaufgaben genutzt werden.
mehrsprachiges OCR-Datensatz Szenentexterkennungsdaten Dokument-OCR-Datensatz elektronische Bildschirmanzeigendaten OCR OCR-Datensatz in 21 Sprachen KI-OCR-Trainingsdaten Texterkennungsdatensatz

200,000 Satze von Bild-Text-Daten zu internationalen Wahrzeichengebäuden

200,000 Sätze von Bild-Text-Daten zu internationalen Wahrzeichengebäuden. Jeder Datensatz besteht aus einem Bild sowie einem Beschreibungsdokument auf Chinesisch und Englisch. Darin sind 80,000 Sätze zu chinesischen Wahrzeichen und 120,000 Sätze zu Wahrzeichen anderer Länder enthalten, mit einer Verteilung auf mindestens 20 Länder wie die Vereinigten Staaten, Großbritannien, Frankreich, Russland, Deutschland u. a. Pro Wahrzeichen liegen 1 bis 10 Bilder vor, die Informationen aus verschiedenen Perspektiven, Entfernungen und Zeitzonen vermitteln. Die Wahrzeichen umfassen verschiedene Typen von Gebäuden, wie Geschäftstürme, alte Bauten, Denkmäler, Bibliotheken, Sehenswürdigkeiten usw. Bei den Annotationen werden das Land des Wahrzeichens, die Stadt, der genaue Standort, die Kategorie sowie die Beschreibung des Wahrzeichens erfasst. Die Daten können für die Erkennung und Analyse von Wahrzeichengebäuden verwendet werden.
Wahrzeichen-Bilddatensatz Gebäudeerkennungsdatensatz Globaler Bild-Beschreibungsdatensatz für Wahrzeichen Bilinguale Bild-Beschreibungsdaten Chinesisch-englischer Beschreibungsdatensatz Wahrzeichen-Klassifikationsdatensatz Bild-Text-Datensatz Touristische Wahrzeichen-Datensatz Kulturerbestands-Bilddatensatz Image Bildbeschriftung für die KI-Training

581 Stunden gesprochene Griechisch-Daten

Griechische gesprochene Sprachdaten, deren Inhalt allgemeine Bereiche wie soziale Medien, Gespräche und Livestreams abdeckt und echte Interaktionssituationen widerspiegelt. Dieser Datensatz ist mit mehreren Attributen wie Textinhalt und Geschlecht des Sprechers annotiert und wurde von mehreren Rumänen aus verschiedenen Regionen und kulturellen Hintergründen aufgenommen. Er zeichnet sich durch hohe Genauigkeit und Benutzerfreundlichkeit aus und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung, wodurch die Modelle in der Lage sind, in realen, vielfältigen Szenarien hervorragende Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und -vorschriften, um die Privatsphäre und die rechtlichen Rechte der Benutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten. Alle Daten entsprechen den Bestimmungen von GDPR, CCPA und PIPL.
griechisches Sprachdatensatz griechische ASR-Trainingsdaten griechisches Konversationskorpus griechische Monologsprache griechisches Spracherkennungsdatensatz Sprache-zu-Text griechische Daten griechisches Sprachdatensatz griechisches Transkriptionsdatensatz

600 Stunden gesprochene norwegische Sprachdaten

Norwegische gesprochene Sprachdaten, deren Inhalt allgemein Bereiche wie Social Media, Dialoge und Livestream abdeckt, spiegeln echte Interaktionssituationen wider. Dieses Datenset enthält Anmerkungen zu Textinhalten, Geschlecht der Sprecher und weiteren Eigenschaften und wurde von mehreren Rumänen aus unterschiedlichen Regionen und Kulturen aufgenommen. Es zeichnet sich durch hohe Genauigkeit und einfache Handhabung aus und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung, wodurch Modelle in der Lage sind, eine herausragende Leistung in der Vielfalt der echten Welt zu zeigen. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zum Schutz der Privatsphäre, um die Privatsphäre und die gesetzlichen Rechte der Nutzer während der Datenerhebung, -speicherung und -nutzung zu gewährleisten; alle Daten entsprechen den Richtlinien von GDPR, CCPA und PIPL.
norwegisches Sprachdatensatz norwegische ASR-Trainingsdaten norwegisches Gesprächskorpus norwegische Monologsprache norwegisches Spracherkennungsdatensatz Sprach-zu-Text norwegische Daten norwegisches Sprachdatensatz mehrsprachige Sprachdaten norwegisches Transkriptionsdatensatz

Hochauflösender Synthesedatensatz für 3D-Szenen_Cockpit

Hochrealistischer 3D-Szenen-Synthesedatensatz_Cockpit: Sensordaten, die durch 3D-Szenenmodellierung erstellt wurden und der realen Welt stark ähneln, einschließlich Kameraaufnahmen, Videosequenzen und Punktwolken. Verfügbare Annotationen beinhalten, sind aber nicht beschränkt auf Kameraparameter, Zielkategorie/Erkennung/Semantische Segmentierung, Zeit-/Licht-/Wetter-Metadaten sowie Körperposen wie Kopf-/Augen-/Arm-/Beinposition und -richtung. Dieser Datensatz kann für Umweltmodellierung und Datensynthese in Anwendungsbereichen wie autonomem Fahren und Robotik verwendet werden.
3D-Synthetikdaten Fahrerüberwachungs-Synthetikdatensatz autonome Fahr-Synthetikdaten hochpräziser Simulationsdatensatz synthetische Punktwolkendaten Kamera-Simulationsdatensatz synthetischer Mensch-Pose-Datensatz synthetischer Lidar-Datensatz 3D-Umgebungsmodellierung Robotik-Synthetikdaten DMS-Datensatz

Japanische OKWAVE Q&A Plattform Text Parsing und Datenverarbeitung

Japan OKWAVE Q&A Plattform Textdaten, einschließlich Fragen, Antworten, Kategorien, Veröffentlichungsdatum, Veröffentlichungsautor und viele andere Felder; die Daten werden laufend aktualisiert, bis Ende April 25, Fragen 8,4 Millionen, 2,3 Milliarden Text; Antworten 27 Millionen, 7,6 Milliarden Text; Dankeschön (der Ausdruck des Dankes des Fragenden an den Antwortenden) 15,5 Millionen, 1,7 Milliarden Text; zusätzliche Hinweise 2,1 Millionen, 360 Millionen Text; diese Daten können für das allgemeine Training großer Modelle verwendet werden
Q&A Text Japanisch

500 Stunden Tamil Sprachaufnahmen für die mobile Datenerfassung

Tamil Sprachdaten-Vorlesen (Handy), basierend auf vorgegebenen Skripten vorgelesen und simuliert aufgenommen, mit reichhaltigem Inhalt. Dieses Datenset kennzeichnet verschiedene Eigenschaften des Textinhalts und wurde von 479 lokalen Personen gesammelt, was eine hohe Genauigkeit gewährleistet. Es bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich Spracherkennung. Mehrere KI-Unternehmen haben dies verifiziert: Es hilft dem Modell, in der Vielfalt der realen Welt hervorragende Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und Privatsphärebestimmungen, um den Schutz der Privatsphäre und der gesetzlichen Rechte der Benutzer während Datenerfassung, Speicherung und Verwendung zu gewährleisten. Alle Daten entsprechen den Vorschriften von GDPR, CCPA und PIPL.
Tamil-Sprachdatensatz Tamil-Audiodatensatz Tamil-Sprachdatensatz Tamil-Monologdatensatz Tamil-Stimmkorpus Tamil-ASR-Daten geskriptete Sprache auf Tamil Smartphone-Tamil-Datensatz Spracherkennungs-Tamil-Datensatz mehrsprachige Sprachdaten

500-Stunden-Lao-Sprechdatensatz – Skriptierter Monolog Handy-Aufnahme

Laotische Sprachdaten_Vorlesen (Handy), basierend auf vorgegebenen Skripten vorgelesen und simuliert aufgenommen, inhaltlich vielfältig. Dieses Datenset ist mit verschiedenen Attributen wie Textinhalt gekennzeichnet, wurde von 418 einheimischen Personen gesammelt, ist hochgenau und bietet reichhaltige Ressourcen für Forschung und Anwendungen im Bereich der Spracherkennung. Von mehreren KI-Unternehmen überprüft: Es hilft dem Modell, in der realen Welt vielfältige Leistungen zu erbringen. Wir halten uns strikt an Datenschutzgesetze und -bestimmungen und stellen sicher, dass während der Datenerfassung, -speicherung und -nutzung die Privatsphäre und rechtlichen Rechte der Nutzer gewahrt bleiben; alle Daten entsprechen GDPR, CCPA, PIPL.
Laotisches Sprachdatensatz Laotisches Monolog-Sprachdatensatz Laotisches Skript-Sprachdatensatz Laotisches Smartphone-Sprachdatensatz Laotisches Stimmendatensatz für TTS Laotisches Audiodatensatz Laotisches Stimmendatensatz für ASR
. . .
loading

loading

de9c4ef2-c339-4261-a49c-0f2e11b63dae