en

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

NLU-Datensätze

Verbessern Sie sofort die Leistung von KI-Modellen mit hochwertigen Standarddatensätzen.

Typ

Alle
34
Identifizierung der Entität
4
Text des Dialogs
1
Intention Verstehen
1
Andere
2
Parallele Korpora
23

5,310,000 Gruppen-Chinesisch-Deutsche Parallelkorpusdaten

5,14 Millionen Sätze des chinesisch-deutschen parallelen Übersetzungskorpus, Datenspeicherformat ist txt-Dokument, das viele Bereiche wie Tourismus, Medizin, tägliches Leben, Nachrichten usw. abdeckt. Die Daten wurden zur Qualitätskontrolle bereinigt und desensibilisiert und können als Basiskorpus für die textbasierte Datenanalyse und maschinelle Übersetzung verwendet werden.
Parallelkorpusdaten Chinesisch-Deutschland Parallelkorpus Chinesisch-Deutschland Parallelkorpusdaten Abgleichkorpusdaten

84,516 Sätze-Englische Intentionsannotationsdaten in interaktiven Szenen

Die Daten zur Erkennung englischer Absichten umfassen insgesamt 84,516 Sätze mit Anmerkungen zu Absichtskategorien, einschließlich Informationen zu Slots und Slot-Werten. Die Absichtsbereiche umfassen Musik, Wetter, Datum, Termine, Haushaltsgeräte usw. Die Daten können für Forschungen im Bereich der Absichtserkennung und verwandten Bereichen verwendet werden.
englische Intent Annotation Daten interaktive Intent Annotation Daten Intent Erkennung nlp Intent Erkennung Daten NLU Daten

1,080,000 Gruppen-Englisch-Russische Parallelkorpusdaten

Insgesamt 1,08 Millionen Paare englischer und russischer Parallelkorpora, wobei sensible Begriffe wie Politik, Pornografie und persönliche Informationen ausgeschlossen wurden; kann als Basiskorpus für die Textdatenanalyse in Bereichen wie der maschinellen Übersetzung verwendet werden.
Englische und russische parallele Korpusdaten englische und russische Korpussammlung englisch-russisches Parallelkorpus parallele Korpusdaten Alignment-Korpusdaten

1,34 Millionen Gruppen-Englisch-Koreanische Parallelkorpusdaten

Insgesamt 1,34 Millionen Paare von englischen und koreanischen Parallelkorpora; sensible Begriffe wie Politik, Pornografie und persönliche Informationen wurden ausgeschlossen; kann als Basiskorpus für die Analyse von Textdaten verwendet werden, beispielsweise für maschinelle Übersetzung.
Parallele englische und koreanische Korpusdaten englische und koreanische Korpussammlung Abgleichskorpus parallele Korpusdaten Abgleichskorpusdaten

380,000 Gruppen-Japanisch-englische Parallelkorpusdaten

Insgesamt 380,000 japanisch-englische Parallelkorpora; sensible Begriffe wie Politik, Pornografie und persönliche Informationen wurden ausgeschlossen; kann als Basiskorpus für die Textdatenanalyse verwendet werden, beispielsweise für maschinelle Übersetzungen.
Japanische und englische Parallelkorpusdaten japanische und englische Parallelkorpus-Sammlung Abgleichskorpus Parallelkorpusdaten Abgleichskorpusdaten

687,694 Offene Felder mit Absichtserklärungsdaten

Die Daten zur Kennzeichnung offener Bereiche wurden durch die Kennzeichnung von 687,694 Textinhalten erstellt, die von Nutzern in mobilen Szenarien tatsächlich generiert wurden. Sie umfassen To-do-Szenarien, Orts-Szenarien und Termin-Szenarien. Die Daten können für Aufgaben wie das Verstehen natürlicher Sprache verwendet werden.
Open-Domain-Daten Intent-Annotation-Daten Textdaten-Annotation SMS-Textdaten nlu-Daten Intentionsverständnis-Daten

47,811 Interaktionsszene Einzelsatz-Intent-Anmerkungsdaten

Interaktive Szenario-Einzelaussagen mit Intent-Annotationsdaten, deren Datenumfang 47,811 Aussagen umfasst, werden mit Intent-Klassen annotiert, einschließlich Slot- und Slot-Wert-Informationen. Die Intent-Domänen umfassen Musik, Wetter, Datum, Termine, Haushaltsgeräte usw. Diese Daten können für die Forschung in verwandten Bereichen wie der Intent-Erkennung verwendet werden.
Absichtserklärungsdaten interaktive Absichtserklärungsdaten Absichtserkennung nlp-Absichtserkennungsdaten NLU-Daten

1,990,000 Gruppen-Chinesisch-tschechische Parallelkorpusdaten

Die Daten des chinesisch-tschechischen Parallelkorpus umfassen 1,99 Millionen Sätze chinesischer und tschechischer Parallelübersetzungen, die im Format txt gespeichert sind. Die Daten wurden zur Qualitätskontrolle bereinigt und desensibilisiert und können als Basiskorpus für die textbasierte Datenanalyse, maschinelle Übersetzung und andere Bereiche verwendet werden.
Chinesische und tschechische parallele Korpusdaten Abgleichskorpus parallele Korpusdaten Abgleichskorpusdaten

10 Millionen traditioneller chinesischer SMS-Korpus

Insgesamt 10 Millionen SMS-Nachrichten in traditionellem Chinesisch, authentische SMS-Daten in traditionellem Chinesisch; enthält nur SMS-Texte; Anmerkungen werden im txt-Format gespeichert; Daten können für Aufgaben wie das Verstehen natürlicher Sprache verwendet werden.
Traditioneller chinesischer SMS-Korpus traditionelle chinesische SMS-Daten traditionelle chinesische SMS-Sammlung traditionelle chinesische Korpusdaten

loading

Passen Sie Ihre Daten jetzt an

Warum Standarddatensätze

  • Urheberrecht

    Urheberrecht

    Klares Copyright und Bereit zur Kontrolle
  • Sicherheit

    Sicherheit

    Ordnungsgemäß autorisiert
  • Professionell

    Professionell

    Entworfen und hergestellt
  • Vielfalt

    Vielfalt

    Gesammelt aus einer Vielzahl von von realen Szenen
  • Kosteneffizient

    Kosteneffizient

    Kosteneffizienter
  • Effizienz

    Effizienz

    Sofortige Lieferung in Sekundenschnelle
cc586740-3c13-4e30-ae45-46c382d49f9c