[{"@type":"PropertyValue","name":"Datenmenge","value":"100000"},{"@type":"PropertyValue","name":"Verwendung der Daten","value":"Wird zum Training verwendet, um die Befolgung von Anweisungen in großen Modellen zu verbessern"},{"@type":"PropertyValue","name":"Inhalt der Daten","value":"Verschiedene komplexe Prompt-Anweisungen, Wortzahl zwischen 50 und 400 Wörtern, nicht weniger als 3 Einschränkungen in jedem Prompt"},{"@type":"PropertyValue","name":"Kategorie Abdeckung","value":"Generierungsklasse (Verfassen von Pressemitteilungen, Interviewskizzen, Copywriting, Manuskriptkorrekturen, chinesische und englische Kompositionen, Grammatikstudium, Forschungsberichte, Studienpläne, Erstellung von Gedichten, Einleitungen zu Lebensmitteln, sanfte Werbung, Verkaufstaktiken, unterstütztes Schreiben von offiziellen Dokumenten, Prüfung von offiziellen Dokumenten, Fragen und Antworten zu politischen Dokumenten usw.), Umschreibeklasse (Umschreiben von Sätzen, Textkorrektur, Zusammenfügen von Sätzen, Vereinfachen von Texten), Zusammenfassungsklasse (Inhaltszusammenfassung), Extraktionsklasse (Extraktion von Ereigniselementen) Viewpoint-Extraktion, Schlüsselwort-Extraktion, Positions-Extraktion, Entity-Extraktion)"},{"@type":"PropertyValue","name":"Produktionsverfahren","value":"Alle Prompts werden manuell geschrieben, um die Vielfalt der Abdeckung zu gewährleisten."},{"@type":"PropertyValue","name":"Sprache","value":"Chinesisch"}]
{"id":1456,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"228","type2str":null,"dataname":"100,000 Instruktionsfolgende Auswertung SFT für chinesische LLM-Textdaten","datazy":[{"title":"Datenmenge","desc":"Datenmenge","content":"100000"},{"title":"Verwendung der Daten","desc":"Verwendung der Daten","content":"Wird zum Training verwendet, um die Befolgung von Anweisungen in großen Modellen zu verbessern"},{"title":"Inhalt der Daten","desc":"Inhalt der Daten","content":"Verschiedene komplexe Prompt-Anweisungen, Wortzahl zwischen 50 und 400 Wörtern, nicht weniger als 3 Einschränkungen in jedem Prompt"},{"title":"Kategorie Abdeckung","desc":"Kategorie Abdeckung","content":"Generierungsklasse (Verfassen von Pressemitteilungen, Interviewskizzen, Copywriting, Manuskriptkorrekturen, chinesische und englische Kompositionen, Grammatikstudium, Forschungsberichte, Studienpläne, Erstellung von Gedichten, Einleitungen zu Lebensmitteln, sanfte Werbung, Verkaufstaktiken, unterstütztes Schreiben von offiziellen Dokumenten, Prüfung von offiziellen Dokumenten, Fragen und Antworten zu politischen Dokumenten usw.), Umschreibeklasse (Umschreiben von Sätzen, Textkorrektur, Zusammenfügen von Sätzen, Vereinfachen von Texten), Zusammenfassungsklasse (Inhaltszusammenfassung), Extraktionsklasse (Extraktion von Ereigniselementen) Viewpoint-Extraktion, Schlüsselwort-Extraktion, Positions-Extraktion, Entity-Extraktion)"},{"title":"Produktionsverfahren","desc":"Produktionsverfahren","content":"Alle Prompts werden manuell geschrieben, um die Vielfalt der Abdeckung zu gewährleisten."},{"title":"Sprache","desc":"Sprache","content":"Chinesisch"}],"datatag":"LLM,Instruction-Following,SFT","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"生成类样例.png","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250718135224/%E7%94%9F%E6%88%90%E7%B1%BB%E6%A0%B7%E4%BE%8B.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=j2dYaUZzrFuOBpHy%2BbE9IzU0uZU%3D","intro":"","size":58978,"progress":100,"type":"jpg"},{"name":"提取类样例.png","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250718135224/%E6%8F%90%E5%8F%96%E7%B1%BB%E6%A0%B7%E4%BE%8B.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=H5qxm0wOjJhXG2j%2Fs%2FjYogclTzE%3D","intro":"","size":29336,"progress":100,"type":"jpg"},{"name":"摘要类样例.png","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250718135224/%E6%91%98%E8%A6%81%E7%B1%BB%E6%A0%B7%E4%BE%8B.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=vLGxT%2FdoEGEPX5%2F0WVVEAF7y7AE%3D","intro":"","size":65076,"progress":100,"type":"jpg"}],"officialSummary":"100,000 Paare komplexer Aufforderungsanweisungen in Chinesisch mit Wortzahlen zwischen 50 und 400 Wörtern und nicht weniger als 3 Einschränkungen in jeder Aufforderung werden für das Training verwendet, um das Befolgen von Anweisungen in großen Modellen zu verbessern. Die Kategorien umfassen Generierung (Schreiben von Pressemitteilungen, Interviewskizzen, Copywriting, Manuskriptkorrektur, chinesische und englische Kompositionen, Grammatikstudium, Forschungsberichte, Studienpläne, Erstellung von Gedichten, Einführung in Lebensmittel, sanfte Werbung, Verkaufstaktiken, Schreiben von offiziellen Dokumenten mit Unterstützung, Überprüfung von offiziellen Dokumenten, Fragen und Antworten zu politischen Dokumenten usw.), Umschreiben (Umschreiben von Sätzen, Textkorrektur, Zusammenfügen von Sätzen, vereinfachtes Copywriting), Zusammenfassen (Inhaltszusammenfassungen), Extrahieren (Ereignisse), Extrahieren von Elementen, Extrahieren von Meinungen, Extrahieren von Schlüsselwörtern) und Extrahieren (Ereignisse). Element-Extraktion, Meinungs-Extraktion, Schlüsselwort-Extraktion, Positions-Extraktion, Entity-Extraktion). Alle Prompts werden manuell verfasst, um die Diversität abzudecken.","dataexampl":null,"datakeyword":["LLM"," Anweisung-folgen"," SFT"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"100,000 Instruction-Following Evaluation SFT for Chinese LLM Text Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"重写类样例.png","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250718135224/%E9%87%8D%E5%86%99%E7%B1%BB%E6%A0%B7%E4%BE%8B.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=SgPlb%2FRyoOnK4YX2Efnr0ZuCJgY%3D","intro":"","size":32077,"progress":100,"type":"jpg"}]}
100,000 Instruktionsfolgende Auswertung SFT für chinesische LLM-Textdaten
LLM
Anweisung-folgen
SFT
100,000 Paare komplexer Aufforderungsanweisungen in Chinesisch mit Wortzahlen zwischen 50 und 400 Wörtern und nicht weniger als 3 Einschränkungen in jeder Aufforderung werden für das Training verwendet, um das Befolgen von Anweisungen in großen Modellen zu verbessern. Die Kategorien umfassen Generierung (Schreiben von Pressemitteilungen, Interviewskizzen, Copywriting, Manuskriptkorrektur, chinesische und englische Kompositionen, Grammatikstudium, Forschungsberichte, Studienpläne, Erstellung von Gedichten, Einführung in Lebensmittel, sanfte Werbung, Verkaufstaktiken, Schreiben von offiziellen Dokumenten mit Unterstützung, Überprüfung von offiziellen Dokumenten, Fragen und Antworten zu politischen Dokumenten usw.), Umschreiben (Umschreiben von Sätzen, Textkorrektur, Zusammenfügen von Sätzen, vereinfachtes Copywriting), Zusammenfassen (Inhaltszusammenfassungen), Extrahieren (Ereignisse), Extrahieren von Elementen, Extrahieren von Meinungen, Extrahieren von Schlüsselwörtern) und Extrahieren (Ereignisse). Element-Extraktion, Meinungs-Extraktion, Schlüsselwort-Extraktion, Positions-Extraktion, Entity-Extraktion). Alle Prompts werden manuell verfasst, um die Diversität abzudecken.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Datenmenge
100000
Verwendung der Daten
Wird zum Training verwendet, um die Befolgung von Anweisungen in großen Modellen zu verbessern
Inhalt der Daten
Verschiedene komplexe Prompt-Anweisungen, Wortzahl zwischen 50 und 400 Wörtern, nicht weniger als 3 Einschränkungen in jedem Prompt
Kategorie Abdeckung
Generierungsklasse (Verfassen von Pressemitteilungen, Interviewskizzen, Copywriting, Manuskriptkorrekturen, chinesische und englische Kompositionen, Grammatikstudium, Forschungsberichte, Studienpläne, Erstellung von Gedichten, Einleitungen zu Lebensmitteln, sanfte Werbung, Verkaufstaktiken, unterstütztes Schreiben von offiziellen Dokumenten, Prüfung von offiziellen Dokumenten, Fragen und Antworten zu politischen Dokumenten usw.), Umschreibeklasse (Umschreiben von Sätzen, Textkorrektur, Zusammenfügen von Sätzen, Vereinfachen von Texten), Zusammenfassungsklasse (Inhaltszusammenfassung), Extraktionsklasse (Extraktion von Ereigniselementen) Viewpoint-Extraktion, Schlüsselwort-Extraktion, Positions-Extraktion, Entity-Extraktion)
Produktionsverfahren
Alle Prompts werden manuell geschrieben, um die Vielfalt der Abdeckung zu gewährleisten.