{"id":1298,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"149","type2str":null,"dataname":"202 Personen-Multi-angle Lip Multimodale Videodaten","datazy":[{"title":"Größe der Daten","desc":"Größe der Daten","content":"202 Personen, jede Person sammelt 13 Audio- und Videosegmente aus verschiedenen Blickwinkeln + 1 txt-Datei."},{"title":"Verteilung des Personals","desc":"Verteilung des Personals","content":"Ethnische Verteilung: gelb (Indonesien); Geschlechterverteilung: 89 Männer, 113 Frauen; Altersverteilung: 165 Personen im Alter von 18-30 Jahren, 32 Personen im Alter von 31-45 Jahren, 5 Personen im Alter von 46-60 Jahren"},{"title":"Akquisitionsumgebung","desc":"Akquisitionsumgebung","content":"Szenen mit natürlichem Licht in Innenräumen, Szenen mit fluoreszierendem Licht in Innenräumen"},{"title":"Vielfalt der Daten","desc":"Vielfalt der Daten","content":"Erfassung einer Vielzahl von Szenen, verschiedenen Alters, verschiedenen Aufnahmewinkeln"},{"title":"Erfassungsgeräte","desc":"Erfassungsgeräte","content":"Mobiltelefon mit einer Videoauflösung von 1,920*1,080"},{"title":"Erfassungswinkel","desc":"Erfassungswinkel","content":"Gleichzeitige Aufnahme von Audio- und Videodaten aus 13 Blickwinkeln: Vorderansicht, 3 Blickwinkel des linken Gesichts, 3 Blickwinkel des rechten Gesichts, Draufsicht, Draufsicht des linken Gesichts, Draufsicht des rechten Gesichts, Draufsicht des linken Gesichts und Draufsicht des rechten Gesichts"},{"title":"Aufgezeichneter Inhalt","desc":"Aufgezeichneter Inhalt","content":"Allgemeiner Bereich mit unbegrenztem Inhalt"},{"title":"Sprache","desc":"Sprache","content":"Mandarin-Chinesisch, jedes Video ist mehr als 20 Sekunden lang"},{"title":"Datenformat","desc":"Datenformat","content":"Videoformat ist .mp4, Audio ist größer oder gleich 16kHz, 16bit, Bildrate ist 25-30fps."},{"title":"Genauigkeit","desc":"Genauigkeit","content":"Zeichengenauigkeit größer als 95%"}],"datatag":"Lip multimodal,Mandarin Chinese,Multiple scenes,Different ages,Different shooting angles","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/002_male_29.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/002_male_29.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ALASNNOKRu%2FsdItuxWu7btO8Gqs%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/001_female_30.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/001_female_30.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=mZRLnTYk5W0s3jRzP7Um81hhRvw%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/156_male_42.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/156_male_42.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2wVvKW6e6XgkYOi9kPqptswFKGs%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"Multi-angle lipographische multimodale Videodaten für 202 Personen. Zu den Aufnahmeumgebungen gehörten Szenen mit natürlichem Licht in Innenräumen und Szenen mit fluoreszierendem Licht in Innenräumen. Als Aufnahmegerät diente ein Mobiltelefon. Die Vielfalt der Erfassung umfasste mehrere Szenen, verschiedene Altersgruppen und 13 Aufnahmewinkel. Die Sprache ist Chinesisch-Mandarin. Der Aufnahmeinhalt ist ein allgemeiner Bereich mit unbegrenztem Inhalt. Die Daten können für die Erforschung multimodaler Lernalgorithmen auf dem Gebiet der Sprachbilder verwendet werden.","dataexampl":null,"datakeyword":["Multi-angle","lip multimodal","Innenszenen mit natürlichem Licht","Innenszenen mit Leuchtstoffröhren","13 Aufnahmewinkel","Mandarin-Chinesisch","allgemeines Feld"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"202 People - Multi-angle Lip Multimodal Video Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/090_female_38.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/090_female_38.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=c6Jkb362VMrtxemlPNPSW%2FkEH%2Fk%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}

de

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

Startseite > Alle Kategorie-Datensätze > Spracherkennungsdatensätze > 202 Personen-Multi-angle Lip Multimodale Videodaten

202 Personen-Multi-angle Lip Multimodale Videodaten

Multi-angle

lip multimodal

Innenszenen mit natürlichem Licht

Innenszenen mit Leuchtstoffröhren

13 Aufnahmewinkel

Mandarin-Chinesisch

allgemeines Feld

Multi-angle lipographische multimodale Videodaten für 202 Personen. Zu den Aufnahmeumgebungen gehörten Szenen mit natürlichem Licht in Innenräumen und Szenen mit fluoreszierendem Licht in Innenräumen. Als Aufnahmegerät diente ein Mobiltelefon. Die Vielfalt der Erfassung umfasste mehrere Szenen, verschiedene Altersgruppen und 13 Aufnahmewinkel. Die Sprache ist Chinesisch-Mandarin. Der Aufnahmeinhalt ist ein allgemeiner Bereich mit unbegrenztem Inhalt. Die Daten können für die Erforschung multimodaler Lernalgorithmen auf dem Gebiet der Sprachbilder verwendet werden.

Bezahlte Datensätze

Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.

Spezifikationen

Spezifikationen

Größe der Daten

202 Personen, jede Person sammelt 13 Audio- und Videosegmente aus verschiedenen Blickwinkeln + 1 txt-Datei.

Verteilung des Personals

Ethnische Verteilung: gelb (Indonesien); Geschlechterverteilung: 89 Männer, 113 Frauen; Altersverteilung: 165 Personen im Alter von 18-30 Jahren, 32 Personen im Alter von 31-45 Jahren, 5 Personen im Alter von 46-60 Jahren

Akquisitionsumgebung

Szenen mit natürlichem Licht in Innenräumen, Szenen mit fluoreszierendem Licht in Innenräumen

Vielfalt der Daten

Erfassung einer Vielzahl von Szenen, verschiedenen Alters, verschiedenen Aufnahmewinkeln

Erfassungsgeräte

Mobiltelefon mit einer Videoauflösung von 1,920*1,080

Erfassungswinkel

Gleichzeitige Aufnahme von Audio- und Videodaten aus 13 Blickwinkeln: Vorderansicht, 3 Blickwinkel des linken Gesichts, 3 Blickwinkel des rechten Gesichts, Draufsicht, Draufsicht des linken Gesichts, Draufsicht des rechten Gesichts, Draufsicht des linken Gesichts und Draufsicht des rechten Gesichts

Aufgezeichneter Inhalt

Allgemeiner Bereich mit unbegrenztem Inhalt

Sprache

Mandarin-Chinesisch, jedes Video ist mehr als 20 Sekunden lang

Datenformat

Videoformat ist .mp4, Audio ist größer oder gleich 16kHz, 16bit, Bildrate ist 25-30fps.

Genauigkeit

Zeichengenauigkeit größer als 95%

Probe

Probe

Empfohlene Datensätze

Empfohlener Datensatz

249,993, 1 Rahmen, 7,262 Gesichtshautfehlermarkierungen

Insgesamt 249,993 facial recognition frames und 7,262 annotierte Datensätze zu Hautdefekten beinhalten Gesichter mit sieben Arten von Hautfehlern: Akne, Muttermal, Narbe, Herpes, Fleck, Sommersprossen und Sonstiges. Die Daten können für Aufgaben wie Hautanalyse und Gesichtserkennung verwendet werden.

Datensatz für Gesichtshautdefekte Akne-Erkennungsdatensatz Hautkrankheiten-Datensatz Gesichtshaut-Datensatz Dermatologie-KI-Datensatz Muttermal-Erkennungsdatensatz Narben-Erkennungsdatensatz Sommersprossen-Erkennungsdatensatz

568 Menschen-Gesichtserkennung & Gesicht 106 Landmarken & menschliche Körpersegmentierung Annotationsdaten in Online-Konferenzszenen

568 Personen, die sich in einer Szene treffen, Gesichtserkennungsrahmen & Gesicht 106 Keypoints & menschliche Körper Keying Annotationsdaten. Die menschliche Ethnie umfasst gelbe, weiße, schwarze und braune Menschen, das Alter ist hauptsächlich mittleres Alter und junge Menschen, und eine Vielzahl von Innen-Büroszenen sind erfasst, die Konferenzräume, Cafés, Bibliotheken, Schlafzimmer und so weiter umfassen. Die Beschriftung einer Person umfasst 61-64 Fotos, die Kennzeichnung des Gesichtserkennungsrahmens und der 106 Keypoints der aufgenommenen Person sowie die Kennzeichnung und Beschriftung des menschlichen Körpers. Die Daten können für Aufgaben wie die Gesichtserkennung, die Erkennung von 106 Keypoints und das Keying des menschlichen Körpers verwendet werden.

Konferenzszenen Gesichtserkennung Gesicht 106 Landmarken Segmentierung des menschlichen Körpers

30,696 Paare von retuschierten Vorher- und Nachher-Bilddaten von Porträts

30,696 Sätze von Vorher- und Nachher-Bilddaten für Studioporträts. Bei den Szenen der Datensammlung handelt es sich um Innen- und Außenszenen, und die Länderverteilung umfasst hauptsächlich Algerien, Ägypten, Ungarn, Polen und Japan. Zu den Datentypen gehören Porträtfotos, Hochzeitsfotos und so weiter. Die gesammelten Studioporträtdaten werden zur Verfeinerung mit Anmerkungen versehen. Die Daten können für die Verfeinerung von Studioporträts, PS-Keying, Porträtsegmentierung und andere Aufgaben verwendet werden.

Porträtdaten Retusche von Vergleichsfotos

88,880 multiethnische, mehrpersönliche und mehrfarbige Daten

88,880 Multi-Personen Multi-Foto-Daten für eine Person. Eine Person enthält mindestens 5 Bilder. Die ethnische Verteilung umfasst gelbe, schwarze, weiße und braune Menschen, und die Altersverteilung reicht von Kleinkindern bis zu älteren Menschen, wobei Menschen mittleren Alters und junge Menschen überwiegen. Zu den Erfassungsumgebungen gehören Innen- und Außenaufnahmen. Die Datenvielfalt umfasst mehrere Altersgruppen, mehrere Szenen, mehrere Gesten und mehrere Gesichtsausdrücke. Die Daten können für Aufgaben wie die Gesichtserkennung verwendet werden. Wir halten uns strikt an die Datenschutzbestimmungen, um sicherzustellen, dass die Privatsphäre und die Rechte der Nutzer bei der Datenerfassung, -speicherung und -verwendung gewahrt bleiben, und zwar in Übereinstimmung mit GDPR, CCPA und PIPL.

Multi-Rasse Multi-Pose Gesicht

4,484 Personen verschiedener Rassen-Infrarot-Gesichtserkennungsdaten

Die 4,484 multiethnischen Infrarot-Gesichtserkennungsdaten wurden sowohl in Innen- als auch in Außenszenen gesammelt. Die Daten umfassen männliche und weibliche Personen, und die ethnische Verteilung ist gelb, schwarz, weiß und braun. Die Altersverteilung reicht von Teenagern bis hin zu älteren Menschen, wobei Menschen mittleren Alters und junge Menschen die Hauptrolle spielen. Das Erfassungsgerät ist DV-DH4,044S305AD. Die Vielfalt der Daten umfasst mehrere Altersgruppen, Gesichter in mehreren Posen und mehrere Szenen. Die Daten können für Aufgaben wie die Infrarot-Gesichtserkennung verwendet werden. Wir halten uns strikt an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die gesetzlichen Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung gewahrt bleiben, und zwar in Übereinstimmung mit GDPR, CCPA und PIPL.

Mehrere Rassen Infrarotgesicht binokulare Kamera mehrere Altersstufen mehrere Gesichtshaltungen mehrere Szenen

500,605 Bilder-Einzelfoto-Gesichtsdaten

500,605 Einzelporträts von Gesichtern. Jede Person ist mit einem Gesichtsbild vertreten. Die ethnische Verteilung umfasst Asiaten, Afroamerikaner, Weiße und Menschen mit brauner Hautfarbe, die Altersverteilung reicht von Säuglingen bis zu älteren Menschen, wobei junge und mittelalte Menschen überwiegen. Die Aufnahmen wurden sowohl in Innenräumen als auch im Freien gemacht. Die Datenvielfalt umfasst verschiedene Altersgruppen, vielfältige Szenarien, unterschiedliche Gesichtsausdrücke und Körperhaltungen. Die Daten können für Aufgaben wie die Gesichtserkennung verwendet werden. Wir halten uns strikt an die Datenschutzbestimmungen und -vorschriften, um die Privatsphäre und die legitimen Rechte der Nutzer bei der Datenerfassung, -speicherung und -nutzung zu schützen. Alle Daten entsprechen den Bestimmungen der DSGVO, des CCPA und des PIPL.

Million id fremdes Gesicht Einzelbild

10,109 Personen-Gesichtsbilder-Datensatz

Die 10,109 People Multicolour Ethnicity Face Recognition-Daten enthalten multinationale Probanden, von denen jeweils mehrere Life-Fotos gesammelt wurden, die mit dem Geschlecht, der ethnischen Zugehörigkeit usw. des Probanden gekennzeichnet sind. Diese Daten können eine reichhaltige Ressource für KI-Anwendungen darstellen und wurden von mehreren KI-Unternehmen verifiziert, damit die Modelle in realen Anwendungen gut funktionieren. Bei der Datenerfassung, -speicherung und -nutzung halten wir uns stets streng an die Datenschutzbestimmungen, um sicherzustellen, dass die Privatsphäre und die gesetzlichen Rechte der Nutzer gewahrt bleiben. Alle Daten entsprechen den gesetzlichen Anforderungen wie GDPR, CCPA und PIPL.

Gesichtserkennung Multi-Pose-Gesicht Kopfhaltung Gesichtshaltung

208 Vietnamesisch-2D Living_Face & Anti_Spoofing Daten

208 vietnamesische 2D-Biopsiedaten. Die Daten wurden in Innenräumen und im Freien gesammelt. Die Daten umfassen Männer und Frauen, und die Altersverteilung reicht von Jugendlichen bis zu älteren Menschen, wobei junge und mittelalte Menschen überwiegen. Die ethnische Verteilung ist vietnamesisch. Die Daten umfassen mehrere Mimiken, mehrere Gesten, Konfrontationsmuster, mehrere Beleuchtungen und mehrere Szenen. Die Daten können für Aufgaben wie die Bezahlung von Gesichtern, die Identitätsüberprüfung aus der Ferne und die Entsperrung von Mobiltelefonen verwendet werden.

Living_face & Anti-Spoofing-Daten Gesicht mehrere Ethnien mehrere Körperhaltungen mehrere Gesichtsausdrücke mehrere Szenen mehrere Anti-Spoofing-Proben mehrere Altersgruppen

Nennen Sie uns Ihre besonderen Bedürfnisse

Projekt-Reifegrad

Frühe Explorationsphase (noch keine konkreten Spezifikationen)

Definierte Ziele, Bedarf an professioneller Beratung

Entwicklungs- oder Optimierungsphase

Daten- und Labeling-Experten mit klaren Spezifikationen

Vollständiger Name *

Telefonnummer des Kontakts*

Name des Unternehmens *

E-mail des Unternehmens *

Datenanforderungen *

Mit dem Absenden erkläre ich mich mit den Datenschutzbestimmungen einverstanden.

Abonnieren Sie unseren Newsletter

Seien Sie der Erste, der die neuesten Nexdata-Produkte, Datenlösungen und Unternehmensnachrichten erhält.

Standard-Datensätze: Alle Kategorie-Datensätze; LLM-Datensätze; Computer Vision-Datensätze; Spracherkennungsdatensätze; Sprachsynthese-Datensätze; OCR-Datensätze; Aussprache-Wörterbuch; NLU-Datensätze

Datendienst: 3D-Punktwolken-Daten; Daten der Straßenansicht; OCR-Daten; Verhaltenserkennung-Daten; Identitätserkennung-Daten; Spracherkennungsdaten; Sprachsynthesedaten; Multimodale Daten

Branchen: Verkörperte KI; Generative KI; Autonome Fahrzeuge; AR/VR; Konversationelle KI; Intelligentes Zuhause; Einzelhandel; Intelligentes Gesundheit

Unternehmen: Über uns; Nachrichten; Partner; Qualität und Sicherheit; Veranstaltung
Links: OPENMPD; DataPlus; Datarade

Plattform: Plattform
Wettbewerb: Wettbewerb
Ressourcen: Gesponserte Datensätze

Schärfen Sie Ihr KI mit Bessere Daten

+1(626)594-5598

[email protected]

nexdata_ai facebook

nexdata_ai twitter

nexdata_ai linkedin

nexdata_ai youtube

Urheberrecht © 2023 NEXDATA TECHNOLOGY INC

Inhaltsverzeichnis Bedingungen und Konditionen

Wir verwenden Cookies, um Ihr Browsing-Erlebnis zu verbessern, personalisierte Werbung oder Inhalte bereitzustellen und unseren Datenverkehr zu analysieren. Wenn Sie auf "Alle akzeptieren" klicken, stimmen Sie unserer Verwendung von Cookies zu.

617b0ea1-4cb2-4ae5-ad1e-f7607726e464

84f1fe26-2cdc-484f-8777-346df958b829