en

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

LLM-Datensätze

Verbessern Sie sofort die Leistung von KI-Modellen mit hochwertigen Standarddatensätzen.

Typ

Alle
34
Bildunterschrift
14
SFT-Datensätze
5
Text zur Vorschulung
17

250,000 Finanzen Testbank

Dieser Datensatz konzentriert sich auf den Finanzbereich und deckt Produkt-, Markt-, Verhaltens-, Grundsatz- und andere Unterbereiche ab, mit insgesamt 250,000 Fragen. Die Gesamtzahl der Fragen in diesem Datensatz beträgt 250,000, wovon die Hälfte Multiple-Choice-Fragen und die Hälfte Quizfragen sind, die sich beide auf 125,000 Fragen belaufen. Die Daten sind im JSONL-Format gespeichert, das reichhaltiges Material für die Erforschung und Untersuchung von Finanzwissen liefern kann.
Finanzen Testfragen Auswahl Q&A

Strukturierte Analyse und Verarbeitung der Daten von 1,5 Millionen koreanischen Testfragen

Strukturierte Analyse der Koreanisch-Prüfungsfragen Verarbeitung der Daten, insgesamt etwa 1,5 Millionen Prüfungsfragen; jede Frage enthält Felder wie Fragetyp, Frage, Antwort und Analyse; Die Fächer umfassen [Grundschule]: Koreanisch, Mathematik, Englisch, Sozialkunde, Naturwissenschaften; [Mittelschule]: Koreanisch, Englisch, Mathematik, Naturwissenschaften, Sozialkunde; [Gymnasium]: Koreanisch, Englisch, Mathematik, Physik, Chemie, Biologie, Geschichte, Geografie; Die Fragetypen umfassen Multiple-Choice-Fragen, Lückentexte, Ja/Nein-Fragen, Frage-Antwort-Fragen usw.; Die Daten können für Aufgaben zur Erweiterung des Fachwissens in großen Modellen verwendet werden.
K12 Fragen Text LLM Koreanisch

Japanische OKWAVE Q&A Plattform Text Parsing und Datenverarbeitung

Japan OKWAVE Q&A Plattform Textdaten, einschließlich Fragen, Antworten, Kategorien, Veröffentlichungsdatum, Veröffentlichungsautor und viele andere Felder; die Daten werden laufend aktualisiert, bis Ende April 25, Fragen 8,4 Millionen, 2,3 Milliarden Text; Antworten 27 Millionen, 7,6 Milliarden Text; Dankeschön (der Ausdruck des Dankes des Fragenden an den Antwortenden) 15,5 Millionen, 1,7 Milliarden Text; zusätzliche Hinweise 2,1 Millionen, 360 Millionen Text; diese Daten können für das allgemeine Training großer Modelle verwendet werden
Q&A Text Japanisch

32 Millionen-Naturwissenschaftliche Fächer Fragen Textanalyse und Datenverarbeitung

32 Millionen naturwissenschaftliche und technische Testfragen mit strukturierter Textanalyse und Datenverarbeitung, darunter Mathematik, Physik, Chemie, Biologie und andere naturwissenschaftliche und technische Fächer in der Grundschule, Mittelschule, Oberschule und Universität. Jede Testfrage enthält Felder wie Frage, Antwort, Analyse, Fragetyp, Disziplin und Abschnitt. Diese Daten können für große Modellaufgaben zur Verbesserung des Fachwissens verwendet werden.
Wissenschaftliche Fächer Fragen LLM Text

1 Million-Chinesische Code-Fragen Text-Parsing und Datenverarbeitung

1,000,000 chinesische Code-Test Fragen Text strukturiert Parsing und Verarbeitung von Daten, einschließlich c, c + +, Python, Java, Javascript mehrere Sprache Code-Test Fragen. Jede Testfrage enthält die Felder Frage, Antwort, Parsing und Sprache. Diese Daten können helfen, Modelle zu bauen und zu konsolidieren Code Programmierkenntnisse für eine bessere Leistung in der Programmierung Aufgaben.
Code Fragen LLM Text

50,000 Sätze-Bildbearbeitungsdaten

50,000 Sätze von Bildbearbeitungsdaten. Zu den Bearbeitungstypen gehören Zielbeseitigung, Ziel hinzufügen, Ziel ändern, Ziel ersetzen. Zu den Bearbeitungszielen gehören Szenen wie Menschen, Tiere, Waren, Pflanzen, Landschaften und so weiter. Entsprechend den Bearbeitungsanweisungen werden die zu bearbeitenden Ziele im Bild verschlüsselt und mit Anmerkungen versehen, die das Entfernen, Hinzufügen, Ändern oder Ersetzen betreffen. Die Daten können für Aufgaben wie Bildsynthese, Datenanreicherung und Erzeugung virtueller Szenen verwendet werden.
Bildbearbeitung

25,000 Menschen-Video-Daten in verschiedenen Stilen

Multi-Style-Videodaten von 25,000 Personen enthalten Multi-Style-Videos von 25.000 Personen in verschiedenen Szenarien, wobei die Hautfarbe der Charaktere weiß/gelb/braun/schwarz und das Alter jung/mittelalt/älter ist, mit einer Videoauflösung von mindestens 1920x1080 und einer Dauer von nicht weniger als 10 Sekunden. Dieser Datensatz kann für Aufgaben wie die Generierung von Videos mit Charakterkonsistenz und die Generierung digitaler Personen verwendet werden.
Menschenbezogenes Video Digitaler Mensch Videoerstellung

100,000 Instruktionsfolgende Auswertung SFT für chinesische LLM-Textdaten

100,000 Paare komplexer Aufforderungsanweisungen in Chinesisch mit Wortzahlen zwischen 50 und 400 Wörtern und nicht weniger als 3 Einschränkungen in jeder Aufforderung werden für das Training verwendet, um das Befolgen von Anweisungen in großen Modellen zu verbessern. Die Kategorien umfassen Generierung (Schreiben von Pressemitteilungen, Interviewskizzen, Copywriting, Manuskriptkorrektur, chinesische und englische Kompositionen, Grammatikstudium, Forschungsberichte, Studienpläne, Erstellung von Gedichten, Einführung in Lebensmittel, sanfte Werbung, Verkaufstaktiken, Schreiben von offiziellen Dokumenten mit Unterstützung, Überprüfung von offiziellen Dokumenten, Fragen und Antworten zu politischen Dokumenten usw.), Umschreiben (Umschreiben von Sätzen, Textkorrektur, Zusammenfügen von Sätzen, vereinfachtes Copywriting), Zusammenfassen (Inhaltszusammenfassungen), Extrahieren (Ereignisse), Extrahieren von Elementen, Extrahieren von Meinungen, Extrahieren von Schlüsselwörtern) und Extrahieren (Ereignisse). Element-Extraktion, Meinungs-Extraktion, Schlüsselwort-Extraktion, Positions-Extraktion, Entity-Extraktion). Alle Prompts werden manuell verfasst, um die Diversität abzudecken.
LLM Anweisung-folgen SFT

120,000 Sätze multidisziplinärer multimodaler Verständnis- und Schlussfolgerungsdaten

120,000 Gruppen multidisziplinärer und multimodaler Verständigungs- und Schlussfolgerungsdaten, die sechs Hauptdisziplinen wie Kunst, Ingenieurwesen, Medizin usw. sowie mehrere Spezialgebiete abdecken, mit professionellen Text-Bild-Mischfragen (z. B. Diagramme, technische Zeichnungen, Analyse von Kunstwerken), wobei jede Frage von Fachpersonal geprüft wird. Dieser Datensatz ermöglicht ein tiefes Verständnis von Text- und Bildinformationen und kann verwendet werden, um die logischen Schlussfolgerungs- und Wissensanwendungsfähigkeiten großer Modelle zu verbessern. Wir halten uns strikt an Datenschutzgesetze und Vorschriften zum Schutz der Privatsphäre, um sicherzustellen, dass bei der Datenerhebung, -speicherung und -nutzung die Privatsphäre und die gesetzlichen Rechte der Nutzer gewahrt bleiben. Alle Daten entsprechen den Bestimmungen der DSGVO, CCPA und PIPL.
multimodales Datenset VQA-Datenset multimodale QA-Daten Reasoning-Datenset für KI Bild-Text-QA-Datenset domänenspezifische KI-Trainingsdaten Diagramm-Reasoning-Datenset LLM-multimodale Trainingsdaten

loading

Passen Sie Ihre Daten jetzt an

Warum Standarddatensätze

  • Urheberrecht

    Urheberrecht

    Klares Copyright und Bereit zur Kontrolle
  • Sicherheit

    Sicherheit

    Ordnungsgemäß autorisiert
  • Professionell

    Professionell

    Entworfen und hergestellt
  • Vielfalt

    Vielfalt

    Gesammelt aus einer Vielzahl von von realen Szenen
  • Kosteneffizient

    Kosteneffizient

    Kosteneffizienter
  • Effizienz

    Effizienz

    Sofortige Lieferung in Sekundenschnelle
7b8ba895-c251-4ae0-a86e-bfa9c71e7fa9