en

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

202 Personen-Multi-angle Lip Multimodale Videodaten

Multi-angle
lip multimodal
Innenszenen mit natürlichem Licht
Innenszenen mit Leuchtstoffröhren
13 Aufnahmewinkel
Mandarin-Chinesisch
allgemeines Feld

Multi-angle lipographische multimodale Videodaten für 202 Personen. Zu den Aufnahmeumgebungen gehörten Szenen mit natürlichem Licht in Innenräumen und Szenen mit fluoreszierendem Licht in Innenräumen. Als Aufnahmegerät diente ein Mobiltelefon. Die Vielfalt der Erfassung umfasste mehrere Szenen, verschiedene Altersgruppen und 13 Aufnahmewinkel. Die Sprache ist Chinesisch-Mandarin. Der Aufnahmeinhalt ist ein allgemeiner Bereich mit unbegrenztem Inhalt. Die Daten können für die Erforschung multimodaler Lernalgorithmen auf dem Gebiet der Sprachbilder verwendet werden.

Bezahlte Datensätze
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
SpezifikationenSpezifikationen
Größe der Daten
202 Personen, jede Person sammelt 13 Audio- und Videosegmente aus verschiedenen Blickwinkeln + 1 txt-Datei.
Verteilung des Personals
Ethnische Verteilung: gelb (Indonesien); Geschlechterverteilung: 89 Männer, 113 Frauen; Altersverteilung: 165 Personen im Alter von 18-30 Jahren, 32 Personen im Alter von 31-45 Jahren, 5 Personen im Alter von 46-60 Jahren
Akquisitionsumgebung
Szenen mit natürlichem Licht in Innenräumen, Szenen mit fluoreszierendem Licht in Innenräumen
Vielfalt der Daten
Erfassung einer Vielzahl von Szenen, verschiedenen Alters, verschiedenen Aufnahmewinkeln
Erfassungsgeräte
Mobiltelefon mit einer Videoauflösung von 1,920*1,080
Erfassungswinkel
Gleichzeitige Aufnahme von Audio- und Videodaten aus 13 Blickwinkeln: Vorderansicht, 3 Blickwinkel des linken Gesichts, 3 Blickwinkel des rechten Gesichts, Draufsicht, Draufsicht des linken Gesichts, Draufsicht des rechten Gesichts, Draufsicht des linken Gesichts und Draufsicht des rechten Gesichts
Aufgezeichneter Inhalt
Allgemeiner Bereich mit unbegrenztem Inhalt
Sprache
Mandarin-Chinesisch, jedes Video ist mehr als 20 Sekunden lang
Datenformat
Videoformat ist .mp4, Audio ist größer oder gleich 16kHz, 16bit, Bildrate ist 25-30fps.
Genauigkeit
Zeichengenauigkeit größer als 95%
Probe Probe
  • 202 Personen-Multi-angle Lip Multimodale Videodaten
  • 202 Personen-Multi-angle Lip Multimodale Videodaten
  • 202 Personen-Multi-angle Lip Multimodale Videodaten
Empfohlene DatensätzeEmpfohlener Datensatz
Nennen Sie uns Ihre besonderen Bedürfnisse

Mit dem Absenden erkläre ich mich mit den Datenschutzbestimmungen einverstanden.

352ed680-349d-4b63-b5c3-ac28eca7afd6

ed87d716-682f-4e52-afa8-9d9e42fe96b6