300 Millionen Datensätze mit hochwertigen Bildbeschreibungen

multimodal

Bild

Beschreibung

300 Millionen Bilder, zu denen jeweils eine Beschreibung gehört. Alle Bilder sind Originalwerke, die von Fotografen veröffentlicht wurden. Die überwiegende Mehrheit der Beschreibungen ist in englischer Sprache verfasst, eine sehr geringe Anzahl in Chinesisch.

Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.

Spezifikationen

Größe der Daten

300 Millionen Bilder, jedes Bild entspricht einer Beschreibung. Die gesamte Bildbibliothek (einschließlich fotografischer Bilder + Vektorbilder usw.) umfasst fast 300 Millionen, und die gesamte Bildbibliothek, die für das generative KI-Training verwendet werden kann (fotografische Bilder + Vektorbilder nach Entfernung der redaktionellen Nachrichtenbilder), umfasst etwa 100 Millionen.

Datenformat

Zu den Bilddatenformaten gehören .jpg, .png, .svg, und das Format der Beschreibungsdatei ist .txt.

Inhalt der Daten

Autorisierte Bildwerke, die vom Autor veröffentlicht wurden, sowie die von ihm verfassten Beschreibungen

Bildtyp

Fotografien und Vektoren, die eine breite Palette von Motivkategorien abdecken

Bildauflösung

4K und mehr

Beschreibungssprache

Die meisten Beschreibungen sind auf Englisch, nur sehr wenige auf Chinesisch.

Empfohlener Datensatz

30 Millionen hochqualitative Videodaten

30 Millionen hochwertige Videodaten, reichhaltige und vielfältige Arten von Ressourcen, mit hoher Auflösung und klarer Bildqualität, hoher Farbwiedergabe und voller Details. Alle Materialien wurden auf legalem Wege erworben und sind klar mit dem Urheberrecht und dem Umfang der Nutzungsgenehmigung gekennzeichnet. Alle Materialien sind mit einer Genehmigung für die kommerzielle Nutzung versehen und wurden für die wissenschaftliche Forschung lizenziert, so dass die Rechte am geistigen Eigentum klar nachvollzogen werden können. Umfangreiche und qualitativ hochwertige Bildressourcen können die Forschung auf dem Gebiet des Computersehens, das Training von Bilderkennungsalgorithmen, die Beschaffung von Materialien für die kreative Gestaltung und viele andere Szenarien wirkungsvoll unterstützen und dazu beitragen, dass die entsprechenden Arbeiten effizient durchgeführt werden können.

Video 4K

80 Millionen Vektorbilddaten

80 Millionen Vektorbilddaten mit reichhaltigen und vielfältigen Ressourcentypen, hoher Farbwiedergabe und voller Details. Alle Materialien wurden auf legalem Wege erworben und sind klar mit dem Urheberrecht und dem Umfang der Nutzungsgenehmigung gekennzeichnet. Alle Materialien sind mit einer Genehmigung für die kommerzielle Nutzung versehen und wurden für die wissenschaftliche Forschung lizenziert, so dass die Rechte am geistigen Eigentum klar nachvollzogen werden können. Umfangreiche und qualitativ hochwertige Bildressourcen können die Forschung auf dem Gebiet des Computersehens, das Training von Bilderkennungsalgorithmen, die Beschaffung von Materialien für die kreative Gestaltung und viele andere Szenarien wirkungsvoll unterstützen und dazu beitragen, dass die entsprechenden Arbeiten effizient durchgeführt werden können.

Bild Vektor

200 Millionen Bilddaten in hoher Qualität

Die Bilddatenbank enthält 200 Millionen professionell geprüfte, qualitativ hochwertige Bilddaten mit einer großen Vielfalt an Ressourcentypen, hoher Auflösung und klarer Bildqualität, hoher Farbwiedergabe und vollständiger Darstellung von Details. Alle Materialien wurden auf legalem Wege erworben und sind klar mit dem Urheberrecht und dem Umfang der Nutzungsgenehmigung gekennzeichnet. Alle Materialien sind mit einer Genehmigung für die kommerzielle Nutzung versehen und wurden für die wissenschaftliche Forschung lizenziert, so dass die Rechte am geistigen Eigentum klar nachvollzogen werden können. Umfangreiche und qualitativ hochwertige Bildressourcen können die Forschung auf dem Gebiet des Computersehens, das Training von Bilderkennungsalgorithmen, die Beschaffung von Materialien für die kreative Gestaltung und viele andere Szenarien wirkungsvoll unterstützen und dazu beitragen, dass die entsprechenden Arbeiten effizient durchgeführt werden können.

Bild 4K

122,147 große Modell-Logik-Reasoning-Daten

Sammlung von 122,147 Aufgaben zur logischen Argumentation, einschließlich Aufgaben zu grafischem Schließen, IQ-Tests, logischem Denkvermögen, visuellen Aufgaben, bildbasiertem Wissen und detektivischem Schließen. Die Aufgaben, Antworten und Erklärungen wurden transkribiert. Dieses Datenset enthält Abläufe des Denkprozesses und kann die logische Schlussfolgerungsfähigkeit großer Modelle verbessern. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zum Schutz der Privatsphäre, um sicherzustellen, dass bei der Erfassung, Speicherung und Nutzung der Daten die Privatsphäre und die rechtlichen Interessen der Nutzer gewahrt bleiben. Alle Daten entsprechen den Regelungen von GDPR, CCPA und PIPL.

Logisch COT VLM

25,000 Menschen-Video-Daten in verschiedenen Stilen

Multi-Style-Videodaten von 25,000 Personen enthalten Multi-Style-Videos von 25.000 Personen in verschiedenen Szenarien, wobei die Hautfarbe der Charaktere weiß/gelb/braun/schwarz und das Alter jung/mittelalt/älter ist, mit einer Videoauflösung von mindestens 1920x1080 und einer Dauer von nicht weniger als 10 Sekunden. Dieser Datensatz kann für Aufgaben wie die Generierung von Videos mit Charakterkonsistenz und die Generierung digitaler Personen verwendet werden.

Menschenbezogenes Video Digitaler Mensch Videoerstellung

70,303 Sätze internationaler Bilder- und Textbeschreibungsdaten

Die Datensätze mit 70,303 multimodalen Bildern und Beschreibungen verschiedener Länderstile umfassen Kategorien wie Kalligraphie, Feiertage, Kleidung, Musikinstrumente und mehr. Jede Abbildung wurde beschrieben, und diese Daten können multimodalen großen Modellen reichhaltige Ressourcen bieten. Nach der Überprüfung durch mehrere KI-Unternehmen tragen diese Daten dazu bei, dass Modelle in realen Anwendungen hervorragende Leistungen erbringen. Bei der Erhebung, Speicherung und Nutzung der Daten haben wir stets die Datenschutz- und Privatsphäregesetze strikt eingehalten, um die Privatsphäre und die gesetzlichen Rechte der Benutzer zu schützen. Alle Daten entsprechen den Anforderungen von Vorschriften wie GDPR, CCPA und PIPL.

AIGC nationale Merkmale Bildunterschrift

7 Millionen Sätze-Hochqualitative Videounterschriften-Daten

7 Millionen echte, hochwertige Videos aus aller Welt. Alle sind echte Videoarbeiten, die von Fotografen weltweit veröffentlicht wurden. Darunter sind 6 Millionen englische Beschreibungen und 1 Million chinesische Beschreibungen. Sie decken eine breite Palette von Kategorien ab, wie Menschen, Landschaften, Tiere usw. Die Auflösung liegt bei über 1,080p.

multimodal Video Beschreibung Beschriftung LLM-Datensatz

1 Million Sätze allgemeiner Szenenbildbeschreibungsdaten (detaillierte Beschreibungen)

Eine Million Bilder und Beschreibungen, die eine breite Palette von Kategorien wie Landschaften, Tiere, Blumen und Bäume, Menschen, Autos, Sport, Industrie und Architektur abdecken, sowie eine Untergruppe der Ästhetik, die die Gesamtszene des Bildes, die Details der Szene und die im Bild ausgedrückten Emotionen beschreibt, sowohl in Englisch als auch in Chinesisch.

Textbeschreibung Multimodalität allgemeiner Szenendatensatz englische Beschriftung chinesische Beschriftung

300 Millionen Datensätze mit hochwertigen Bildbeschreibungen

multimodal Bild Beschreibung

300 Millionen Bilder, zu denen jeweils eine Beschreibung gehört. Alle Bilder sind Originalwerke, die von Fotografen veröffentlicht wurden. Die überwiegende Mehrheit der Beschreibungen ist in englischer Sprache verfasst, eine sehr geringe Anzahl in Chinesisch.

Projekt-Reifegrad

multimodal

Bild

Beschreibung