[{"@type":"PropertyValue","name":"Größe der Daten","value":"202 Personen, jede Person sammelt 13 Audio- und Videosegmente aus verschiedenen Blickwinkeln + 1 txt-Datei."},{"@type":"PropertyValue","name":"Verteilung des Personals","value":"Ethnische Verteilung: gelb (Indonesien); Geschlechterverteilung: 89 Männer, 113 Frauen; Altersverteilung: 165 Personen im Alter von 18-30 Jahren, 32 Personen im Alter von 31-45 Jahren, 5 Personen im Alter von 46-60 Jahren"},{"@type":"PropertyValue","name":"Akquisitionsumgebung","value":"Szenen mit natürlichem Licht in Innenräumen, Szenen mit fluoreszierendem Licht in Innenräumen"},{"@type":"PropertyValue","name":"Vielfalt der Daten","value":"Erfassung einer Vielzahl von Szenen, verschiedenen Alters, verschiedenen Aufnahmewinkeln"},{"@type":"PropertyValue","name":"Erfassungsgeräte","value":"Mobiltelefon mit einer Videoauflösung von 1,920*1,080"},{"@type":"PropertyValue","name":"Erfassungswinkel","value":"Gleichzeitige Aufnahme von Audio- und Videodaten aus 13 Blickwinkeln: Vorderansicht, 3 Blickwinkel des linken Gesichts, 3 Blickwinkel des rechten Gesichts, Draufsicht, Draufsicht des linken Gesichts, Draufsicht des rechten Gesichts, Draufsicht des linken Gesichts und Draufsicht des rechten Gesichts"},{"@type":"PropertyValue","name":"Aufgezeichneter Inhalt","value":"Allgemeiner Bereich mit unbegrenztem Inhalt"},{"@type":"PropertyValue","name":"Sprache","value":"Mandarin-Chinesisch, jedes Video ist mehr als 20 Sekunden lang"},{"@type":"PropertyValue","name":"Datenformat","value":"Videoformat ist .mp4, Audio ist größer oder gleich 16kHz, 16bit, Bildrate ist 25-30fps."},{"@type":"PropertyValue","name":"Genauigkeit","value":"Zeichengenauigkeit größer als 95%"}]
{"id":1298,"datatype":"1","titleimg":"https://de.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"149","type2str":null,"dataname":"202 Personen-Multi-angle Lip Multimodale Videodaten","datazy":[{"title":"Größe der Daten","desc":"Größe der Daten","content":"202 Personen, jede Person sammelt 13 Audio- und Videosegmente aus verschiedenen Blickwinkeln + 1 txt-Datei."},{"title":"Verteilung des Personals","desc":"Verteilung des Personals","content":"Ethnische Verteilung: gelb (Indonesien); Geschlechterverteilung: 89 Männer, 113 Frauen; Altersverteilung: 165 Personen im Alter von 18-30 Jahren, 32 Personen im Alter von 31-45 Jahren, 5 Personen im Alter von 46-60 Jahren"},{"title":"Akquisitionsumgebung","desc":"Akquisitionsumgebung","content":"Szenen mit natürlichem Licht in Innenräumen, Szenen mit fluoreszierendem Licht in Innenräumen"},{"title":"Vielfalt der Daten","desc":"Vielfalt der Daten","content":"Erfassung einer Vielzahl von Szenen, verschiedenen Alters, verschiedenen Aufnahmewinkeln"},{"title":"Erfassungsgeräte","desc":"Erfassungsgeräte","content":"Mobiltelefon mit einer Videoauflösung von 1,920*1,080"},{"title":"Erfassungswinkel","desc":"Erfassungswinkel","content":"Gleichzeitige Aufnahme von Audio- und Videodaten aus 13 Blickwinkeln: Vorderansicht, 3 Blickwinkel des linken Gesichts, 3 Blickwinkel des rechten Gesichts, Draufsicht, Draufsicht des linken Gesichts, Draufsicht des rechten Gesichts, Draufsicht des linken Gesichts und Draufsicht des rechten Gesichts"},{"title":"Aufgezeichneter Inhalt","desc":"Aufgezeichneter Inhalt","content":"Allgemeiner Bereich mit unbegrenztem Inhalt"},{"title":"Sprache","desc":"Sprache","content":"Mandarin-Chinesisch, jedes Video ist mehr als 20 Sekunden lang"},{"title":"Datenformat","desc":"Datenformat","content":"Videoformat ist .mp4, Audio ist größer oder gleich 16kHz, 16bit, Bildrate ist 25-30fps."},{"title":"Genauigkeit","desc":"Genauigkeit","content":"Zeichengenauigkeit größer als 95%"}],"datatag":"Lip multimodal,Mandarin Chinese,Multiple scenes,Different ages,Different shooting angles","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/002_male_29.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/002_male_29.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ALASNNOKRu%2FsdItuxWu7btO8Gqs%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/001_female_30.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/001_female_30.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=mZRLnTYk5W0s3jRzP7Um81hhRvw%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/156_male_42.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/156_male_42.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2wVvKW6e6XgkYOi9kPqptswFKGs%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"Multi-angle lipographische multimodale Videodaten für 202 Personen. Zu den Aufnahmeumgebungen gehörten Szenen mit natürlichem Licht in Innenräumen und Szenen mit fluoreszierendem Licht in Innenräumen. Als Aufnahmegerät diente ein Mobiltelefon. Die Vielfalt der Erfassung umfasste mehrere Szenen, verschiedene Altersgruppen und 13 Aufnahmewinkel. Die Sprache ist Chinesisch-Mandarin. Der Aufnahmeinhalt ist ein allgemeiner Bereich mit unbegrenztem Inhalt. Die Daten können für die Erforschung multimodaler Lernalgorithmen auf dem Gebiet der Sprachbilder verwendet werden.","dataexampl":null,"datakeyword":["Multi-angle"," lip multimodal"," Innenszenen mit natürlichem Licht"," Innenszenen mit Leuchtstoffröhren"," 13 Aufnahmewinkel"," Mandarin-Chinesisch"," allgemeines Feld"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"202 People - Multi-angle Lip Multimodal Video Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/090_female_38.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/090_female_38.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=c6Jkb362VMrtxemlPNPSW%2FkEH%2Fk%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
Multi-angle lipographische multimodale Videodaten für 202 Personen. Zu den Aufnahmeumgebungen gehörten Szenen mit natürlichem Licht in Innenräumen und Szenen mit fluoreszierendem Licht in Innenräumen. Als Aufnahmegerät diente ein Mobiltelefon. Die Vielfalt der Erfassung umfasste mehrere Szenen, verschiedene Altersgruppen und 13 Aufnahmewinkel. Die Sprache ist Chinesisch-Mandarin. Der Aufnahmeinhalt ist ein allgemeiner Bereich mit unbegrenztem Inhalt. Die Daten können für die Erforschung multimodaler Lernalgorithmen auf dem Gebiet der Sprachbilder verwendet werden.
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
Spezifikationen
Größe der Daten
202 Personen, jede Person sammelt 13 Audio- und Videosegmente aus verschiedenen Blickwinkeln + 1 txt-Datei.
Verteilung des Personals
Ethnische Verteilung: gelb (Indonesien); Geschlechterverteilung: 89 Männer, 113 Frauen; Altersverteilung: 165 Personen im Alter von 18-30 Jahren, 32 Personen im Alter von 31-45 Jahren, 5 Personen im Alter von 46-60 Jahren
Akquisitionsumgebung
Szenen mit natürlichem Licht in Innenräumen, Szenen mit fluoreszierendem Licht in Innenräumen
Vielfalt der Daten
Erfassung einer Vielzahl von Szenen, verschiedenen Alters, verschiedenen Aufnahmewinkeln
Erfassungsgeräte
Mobiltelefon mit einer Videoauflösung von 1,920*1,080
Erfassungswinkel
Gleichzeitige Aufnahme von Audio- und Videodaten aus 13 Blickwinkeln: Vorderansicht, 3 Blickwinkel des linken Gesichts, 3 Blickwinkel des rechten Gesichts, Draufsicht, Draufsicht des linken Gesichts, Draufsicht des rechten Gesichts, Draufsicht des linken Gesichts und Draufsicht des rechten Gesichts
Aufgezeichneter Inhalt
Allgemeiner Bereich mit unbegrenztem Inhalt
Sprache
Mandarin-Chinesisch, jedes Video ist mehr als 20 Sekunden lang
Datenformat
Videoformat ist .mp4, Audio ist größer oder gleich 16kHz, 16bit, Bildrate ist 25-30fps.