Startseite > Alle Kategorie-Datensätze > LLM-Datensätze > 100,000 Instruktionsfolgende Auswertung SFT für chinesische LLM-Textdaten

100,000 Instruktionsfolgende Auswertung SFT für chinesische LLM-Textdaten

LLM

Anweisung-folgen

SFT

100,000 Paare komplexer Aufforderungsanweisungen in Chinesisch mit Wortzahlen zwischen 50 und 400 Wörtern und nicht weniger als 3 Einschränkungen in jeder Aufforderung werden für das Training verwendet, um das Befolgen von Anweisungen in großen Modellen zu verbessern. Die Kategorien umfassen Generierung (Schreiben von Pressemitteilungen, Interviewskizzen, Copywriting, Manuskriptkorrektur, chinesische und englische Kompositionen, Grammatikstudium, Forschungsberichte, Studienpläne, Erstellung von Gedichten, Einführung in Lebensmittel, sanfte Werbung, Verkaufstaktiken, Schreiben von offiziellen Dokumenten mit Unterstützung, Überprüfung von offiziellen Dokumenten, Fragen und Antworten zu politischen Dokumenten usw.), Umschreiben (Umschreiben von Sätzen, Textkorrektur, Zusammenfügen von Sätzen, vereinfachtes Copywriting), Zusammenfassen (Inhaltszusammenfassungen), Extrahieren (Ereignisse), Extrahieren von Elementen, Extrahieren von Meinungen, Extrahieren von Schlüsselwörtern) und Extrahieren (Ereignisse). Element-Extraktion, Meinungs-Extraktion, Schlüsselwort-Extraktion, Positions-Extraktion, Entity-Extraktion). Alle Prompts werden manuell verfasst, um die Diversität abzudecken.

Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.

Spezifikationen

Datenmenge

100000

Verwendung der Daten

Wird zum Training verwendet, um die Befolgung von Anweisungen in großen Modellen zu verbessern

Inhalt der Daten

Verschiedene komplexe Prompt-Anweisungen, Wortzahl zwischen 50 und 400 Wörtern, nicht weniger als 3 Einschränkungen in jedem Prompt

Kategorie Abdeckung

Generierungsklasse (Verfassen von Pressemitteilungen, Interviewskizzen, Copywriting, Manuskriptkorrekturen, chinesische und englische Kompositionen, Grammatikstudium, Forschungsberichte, Studienpläne, Erstellung von Gedichten, Einleitungen zu Lebensmitteln, sanfte Werbung, Verkaufstaktiken, unterstütztes Schreiben von offiziellen Dokumenten, Prüfung von offiziellen Dokumenten, Fragen und Antworten zu politischen Dokumenten usw.), Umschreibeklasse (Umschreiben von Sätzen, Textkorrektur, Zusammenfügen von Sätzen, Vereinfachen von Texten), Zusammenfassungsklasse (Inhaltszusammenfassung), Extraktionsklasse (Extraktion von Ereigniselementen) Viewpoint-Extraktion, Schlüsselwort-Extraktion, Positions-Extraktion, Entity-Extraktion)

Produktionsverfahren

Alle Prompts werden manuell geschrieben, um die Vielfalt der Abdeckung zu gewährleisten.

Sprache

Chinesisch

100,000 Instruktionsfolgende Auswertung SFT für chinesische LLM-Textdaten

LLM Anweisung-folgen SFT

Projekt-Reifegrad

LLM

Anweisung-folgen

SFT