en

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

155 Stunden-Lippensynchrone multimodale Videodaten

Lippensprache
Multimodal
Mandarin
Lesen
Mobiltelefon
Videokamera

249 Personen haben an der Aufnahme von Sprachaufnahmen und den dazugehörigen Lippensynchronisationsvideos teilgenommen. Die Aufnahmen wurden mit mehreren Geräten synchronisiert und durch Impulssignale präzise aufeinander abgestimmt, wodurch eine hohe Genauigkeit gewährleistet wurde. Diese Daten können für die Forschung im Bereich multimodaler Lernalgorithmen für Sprach- und Bilddaten verwendet werden. Sie wurden von mehreren KI-Unternehmen validiert und tragen dazu bei, dass Modelle angesichts der Vielfalt der realen Welt hervorragende Leistungen erbringen können. Wir halten uns strikt an die Datenschutzbestimmungen und -vorschriften, um die Privatsphäre und die legitimen Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung zu schützen. Alle Daten unterliegen der DSGVO, dem CCPA und dem PIPL.

Bezahlte Datensätze
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
SpezifikationenSpezifikationen
Formatierung
Videoformat: mp4, 1,280*720; Audioformat: WAV, 16kHz, 16bit, Mono
Aufnahmeumgebung
Ruhiger Innenraum mit Fenstern auf der Sonnenseite, der eine Fahrszene im Freien bei Tageslicht simuliert; Signal-Rausch-Verhältnis 15 bis 20 dB
Aufnahmeszene
Je nach Lichtintensität in verschiedene Haupt- und Nebenszenen unterteilt
Aufgezeichneter Inhalt
Kurze Befehle; gesprochene Sätze
Tontechniker
249 Chinesen, darunter 125 Männer und 124 Frauen
Erfassungsgeräte
Kamera, High-Fidelity-Mikrofon, Soundkarte
Aufnahmewinkel
Gleichzeitige Aufzeichnung von Videos (mit Ton und Bild) aus sechs Blickwinkeln: frontal, einseitige Seitenansicht, von oben, von unten, Seitenansicht von oben, Seitenansicht von unten sowie Audioaufnahmen (ohne Video) aus zwei Entfernungen: nah und fern
Sprache
Mandarin
Anwendungsszenario
Lippenlesen
Genauigkeit
95% Satzgenauigkeit
Probe Probe
Empfohlene DatensätzeEmpfohlener Datensatz
Nennen Sie uns Ihre besonderen Bedürfnisse

Mit dem Absenden erkläre ich mich mit den Datenschutzbestimmungen einverstanden.

1507c23a-b33b-47cb-a693-3e09ae7ac5c0

bf16d6d7-adcf-4d2d-819e-6900bfbd3e66