5,010,000 Gruppen-Chinesisch-Tibetische Parallelkorpusdaten

Chinesische und tibetische parallele Korpusdaten

Abgleichskorpus

parallele Korpusdaten

Abgleichskorpusdaten

Die Daten des chinesisch-tibetischen Parallelkorpus umfassen 5,01 Millionen Sätze chinesischer und tibetischer Parallelübersetzungen, die im txt-Format gespeichert sind. Die Daten wurden zur Qualitätskontrolle bereinigt und desensibilisiert und können als Basiskorpus für die Analyse von Textdaten, maschinelle Übersetzung und andere Bereiche verwendet werden.

Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.

Empfohlener Datensatz

5,500,000 Gruppen-Türkisch-englische Parallelkorpusdaten

5,5 Millionen türkisch-englische Parallelübersetzungskorpus, Datenspeicherformat ist txt-Dokument, der Inhalt deckt eine Vielzahl von Bereichen ab. Die Daten wurden zur Qualitätskontrolle bereinigt und desensibilisiert und können als Basiskorpus für die textbasierte Datenanalyse und maschinelle Übersetzung verwendet werden.

Parallelkorpus Tukish Engling

1,980,000 Gruppen-Chinesisch-Polnische Parallelkorpusdaten

Die Daten des chinesisch-polnischen Parallelkorpus umfassen 1,98 Millionen Sätze chinesischer und polnischer Parallelübersetzungen, die im Format txt gespeichert sind. Die Daten wurden zur Qualitätskontrolle bereinigt und desensibilisiert und können als Basiskorpus für die Analyse von Textdaten, maschinelle Übersetzung und andere Bereiche verwendet werden.

Chinesische und polnische parallele Korpusdaten Abgleichskorpus parallele Korpusdaten Abgleichskorpusdaten

1,990,000 Gruppen-Chinesisch-tschechische Parallelkorpusdaten

Die Daten des chinesisch-tschechischen Parallelkorpus umfassen 1,99 Millionen Sätze chinesischer und tschechischer Parallelübersetzungen, die im Format txt gespeichert sind. Die Daten wurden zur Qualitätskontrolle bereinigt und desensibilisiert und können als Basiskorpus für die textbasierte Datenanalyse, maschinelle Übersetzung und andere Bereiche verwendet werden.

Chinesische und tschechische parallele Korpusdaten Abgleichskorpus parallele Korpusdaten Abgleichskorpusdaten

980,000 Gruppen-Chinesisch-Urdu-Parallelkorpusdaten

Die Daten des parallelen Chinesisch-Urdu-Korpus umfassen 980,000 Sätze des parallelen Chinesisch- und Urdu-Übersetzungskorpus, und das Format der Datenspeicherung ist ein txt-Dokument. Die Daten wurden zur Qualitätskontrolle bereinigt und desensibilisiert und können als Basiskorpus für die Analyse von Textdaten, maschinelle Übersetzung und andere Bereiche verwendet werden.

Parallele Korpusdaten für Chinesisch und Urdu Abgleichskorpus Parallele Korpusdaten Abgleichskorpusdaten

1,140,000 Gruppen-Chinesisch-Hebräisch Parallele Korpusdaten

1,14 Millionen Sätze des parallelen chinesisch-hebräischen Übersetzungskorpus, Datenspeicherformat für txt-Dateien, für Tourismus, Alltagsleben, Nachrichten und andere Bereiche. Die Daten wurden bereinigt und desensibilisiert und können als Basiskorpus für die Analyse von Textdaten und die maschinelle Übersetzung verwendet werden.

Parallelkorpusdaten Chinesisch-Hebräisch Parallelkorpus Chinesisch-Hebräisch Parallelkorpusdaten Abgleichkorpusdaten

12,82 Millionen Gruppen-Chinesisch-Koreanische Parallelkorpusdaten

12,820,000 Sätze chinesischer und koreanischer Parallelübersetzungen, Datenspeicherformat ist txt-Dokument, die eine Vielzahl von Bereichen wie gesprochene Sprache, Tourismus, Nachrichten, Finanzen usw. abdecken. Die Daten wurden zur Qualitätskontrolle bereinigt und desensibilisiert und können als Basiskorpus für die textbasierte Datenanalyse, für die maschinelle Übersetzung und andere Bereiche verwendet werden.

China und Südkorea Parallelkorpus Korpusdaten Abgleichskorpus Parallelkorpusdaten Abgleichskorpusdaten

3,140,000 Gruppen-Chinesisch-spanische Parallelkorpusdaten

3,14 Millionen Sätze chinesischer und westlicher Parallelübersetzungen, das Speicherformat ist txt-Dokument, die Daten stammen aus dem Bereich Wissenschaft und Technik. Die Daten wurden zur Qualitätskontrolle bereinigt und desensibilisiert und können als Basiskorpus für die textbasierte Datenanalyse in der maschinellen Übersetzung und anderen Bereichen verwendet werden.

Parallelkorpusdaten Chinesisch - Spanisch Parallelkorpus Chinesisch - Spanisch Parallelkorpusdaten Abgleichkorpus Parallelkorpusdaten Abgleichkorpusdaten

850,000 Gruppen-Englisch-Japanisch Parallele Korpusdaten

850,000 Sätze eines parallelen Übersetzungskorpus Englisch-Japanisch, das Format der Datenspeicherung ist txt-Dokument, das eine Vielzahl von Bereichen wie Tourismus, Medizin, tägliches Leben, Nachrichten usw. abdeckt. Die Daten wurden zur Qualitätskontrolle bereinigt und desensibilisiert und können als Basiskorpus für die textbasierte Datenanalyse und maschinelle Übersetzung verwendet werden.

Englisch-Japanische Parallelkorpusdaten Englisch-Japanischer Parallelkorpus Parallelkorpusdaten Abgleichkorpusdaten

5,010,000 Gruppen-Chinesisch-Tibetische Parallelkorpusdaten

Chinesische und tibetische parallele Korpusdaten Abgleichskorpus parallele Korpusdaten Abgleichskorpusdaten

Projekt-Reifegrad

Chinesische und tibetische parallele Korpusdaten

Abgleichskorpus

parallele Korpusdaten

Abgleichskorpusdaten