en

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

31 Millionen Nachrichtendaten in südostasiatischen Sprachen

Minderheitensprachen
Südostasien
NEWS
Journalismus

Bei diesem Datensatz handelt es sich um mehrsprachige Nachrichtendaten für Südostasien, die vier Sprachen abdecken: Indonesisch, Malaiisch, Thai und Vietnamesisch. Die Gesamtzahl der Daten beläuft sich auf mehr als 31 Millionen. Die Daten sind im JSONL-Format gespeichert, wobei jeder Datensatz in einer separaten Zeile steht, was einfach zu lesen und effizient zu verarbeiten ist. Die Daten stammen aus einer Vielzahl von Quellen und decken eine Vielzahl von Nachrichtenthemen ab, die die soziale Dynamik, kulturelle Brennpunkte und wirtschaftliche Trends in Südostasien umfassend widerspiegeln können. Dieser Datensatz kann Big Models dabei helfen, die Mehrsprachigkeit zu verbessern, das kulturelle Wissen zu erweitern, die Leistung zu optimieren, die Anwendungen für die südostasiatische Industrie zu erweitern und die sprachübergreifende Forschung zu fördern.

Bezahlte Datensätze
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
SpezifikationenSpezifikationen
Sprachtyp
Indonesisch, Malaiisch, Thailändisch, Vietnamesisch
Datenmenge
Indonesisch 14,447,771, Malaiisch 1,239,420, Thailändisch 6,467,564, Vietnamesisch 8,942,813, insgesamt über 31 Millionen Einträge.
Feld
URL,Titel,Veröffentlichungszeit,Artikel_Inhalt,Kategorie
Formatierung
Jsonl
Probe Probe
  • 31 Millionen Nachrichtendaten in südostasiatischen Sprachen
  • 31 Millionen Nachrichtendaten in südostasiatischen Sprachen
  • 31 Millionen Nachrichtendaten in südostasiatischen Sprachen
Empfohlene DatensätzeEmpfohlener Datensatz
Nennen Sie uns Ihre besonderen Bedürfnisse

Mit dem Absenden erkläre ich mich mit den Datenschutzbestimmungen einverstanden.

4d5e1b54-e059-41a4-b970-8b3d27eef15e

bec20634-f4e1-4687-8fdf-63c5a601183b