[{"@type":"PropertyValue","name":"Größe der Daten","value":"300 Millionen Bilder, jedes Bild entspricht einer Beschreibung. Die gesamte Bildbibliothek (einschließlich fotografischer Bilder + Vektorbilder usw.) umfasst fast 300 Millionen, und die gesamte Bildbibliothek, die für das generative KI-Training verwendet werden kann (fotografische Bilder + Vektorbilder nach Entfernung der redaktionellen Nachrichtenbilder), umfasst etwa 100 Millionen."},{"@type":"PropertyValue","name":"Datenformat","value":"Zu den Bilddatenformaten gehören .jpg, .png, .svg, und das Format der Beschreibungsdatei ist .txt."},{"@type":"PropertyValue","name":"Inhalt der Daten","value":"Autorisierte Bildwerke, die vom Autor veröffentlicht wurden, sowie die von ihm verfassten Beschreibungen"},{"@type":"PropertyValue","name":"Bildtyp","value":"Fotografien und Vektoren, die eine breite Palette von Motivkategorien abdecken"},{"@type":"PropertyValue","name":"Bildauflösung","value":"4K und mehr"},{"@type":"PropertyValue","name":"Beschreibungssprache","value":"Die meisten Beschreibungen sind auf Englisch, nur sehr wenige auf Chinesisch."}]
{"id":1451,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"254","type2str":null,"dataname":"300 Millionen Datensätze mit hochwertigen Bildbeschreibungen","datazy":[{"title":"Größe der Daten","desc":"Größe der Daten","content":"300 Millionen Bilder, jedes Bild entspricht einer Beschreibung. Die gesamte Bildbibliothek (einschließlich fotografischer Bilder + Vektorbilder usw.) umfasst fast 300 Millionen, und die gesamte Bildbibliothek, die für das generative KI-Training verwendet werden kann (fotografische Bilder + Vektorbilder nach Entfernung der redaktionellen Nachrichtenbilder), umfasst etwa 100 Millionen."},{"title":"Datenformat","desc":"Datenformat","content":"Zu den Bilddatenformaten gehören .jpg, .png, .svg, und das Format der Beschreibungsdatei ist .txt."},{"title":"Inhalt der Daten","desc":"Inhalt der Daten","content":"Autorisierte Bildwerke, die vom Autor veröffentlicht wurden, sowie die von ihm verfassten Beschreibungen"},{"title":"Bildtyp","desc":"Bildtyp","content":"Fotografien und Vektoren, die eine breite Palette von Motivkategorien abdecken"},{"title":"Bildauflösung","desc":"Bildauflösung","content":"4K und mehr"},{"title":"Beschreibungssprache","desc":"Beschreibungssprache","content":"Die meisten Beschreibungen sind auf Englisch, nur sehr wenige auf Chinesisch."}],"datatag":"","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"300 Millionen Bilder, zu denen jeweils eine Beschreibung gehört. Alle Bilder sind Originalwerke, die von Fotografen veröffentlicht wurden. Die überwiegende Mehrheit der Beschreibungen ist in englischer Sprache verfasst, eine sehr geringe Anzahl in Chinesisch.","dataexampl":null,"datakeyword":["multimodal"," Bild"," Beschreibung"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"300 million pairs of high-quality image-caption dataset","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
300 Millionen Datensätze mit hochwertigen Bildbeschreibungen
multimodal
Bild
Beschreibung
300 Millionen Bilder, zu denen jeweils eine Beschreibung gehört. Alle Bilder sind Originalwerke, die von Fotografen veröffentlicht wurden. Die überwiegende Mehrheit der Beschreibungen ist in englischer Sprache verfasst, eine sehr geringe Anzahl in Chinesisch.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Größe der Daten
300 Millionen Bilder, jedes Bild entspricht einer Beschreibung. Die gesamte Bildbibliothek (einschließlich fotografischer Bilder + Vektorbilder usw.) umfasst fast 300 Millionen, und die gesamte Bildbibliothek, die für das generative KI-Training verwendet werden kann (fotografische Bilder + Vektorbilder nach Entfernung der redaktionellen Nachrichtenbilder), umfasst etwa 100 Millionen.
Datenformat
Zu den Bilddatenformaten gehören .jpg, .png, .svg, und das Format der Beschreibungsdatei ist .txt.
Inhalt der Daten
Autorisierte Bildwerke, die vom Autor veröffentlicht wurden, sowie die von ihm verfassten Beschreibungen
Bildtyp
Fotografien und Vektoren, die eine breite Palette von Motivkategorien abdecken
Bildauflösung
4K und mehr
Beschreibungssprache
Die meisten Beschreibungen sind auf Englisch, nur sehr wenige auf Chinesisch.