[{"@type":"PropertyValue","name":"データ規模","value":"202人がそれぞれ13本の異なるアングルのオーディオとビデオと1本のTXT文書を収集します"},{"@type":"PropertyValue","name":"人物属性","value":"人種分布: 黄色(インドネシア人); 性別分布: 男性 89 人、女性 113 人; 年齢分布: 18~30 歳 165 人、31~45 歳 32 人、46~60 歳 5 人"},{"@type":"PropertyValue","name":"収集環境","value":"屋内の自然光シーン、屋内の蛍光灯シーン"},{"@type":"PropertyValue","name":"データの多様性","value":"さまざまなシーン、さまざまな年齢、さまざまな撮影アングルをカバーします"},{"@type":"PropertyValue","name":"収集設備","value":"スマホ、ビデオ解像度は1,920*1,080"},{"@type":"PropertyValue","name":"収集アングル","value":"同時に、正面顔、左顔3角度、右顔3角度、仰視、俯瞰、左側下を向く、右側下を向く、左側上を向く、右側上を向くの13角度の音声とビデオのデータを収集します。"},{"@type":"PropertyValue","name":"録音内容","value":"汎用分野、内容制限なし"},{"@type":"PropertyValue","name":"言語","value":"中国語普通語、各ビデオの長さは20秒以上です"},{"@type":"PropertyValue","name":"データフォーマット","value":"ビデオ形式は.mp4、オーディオは16KHz、16ビット以上、フレームレートは25~30fpsです。"},{"@type":"PropertyValue","name":"正確率","value":"文字の正確率95%"}]
{"id":1298,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"149","type2str":null,"dataname":"202人のマルチアングル唇形状マルチモーダルビデオデータ","datazy":[{"title":"データ規模","desc":"データ規模","content":"202人がそれぞれ13本の異なるアングルのオーディオとビデオと1本のTXT文書を収集します"},{"title":"人物属性","desc":"人物属性","content":"人種分布: 黄色(インドネシア人); 性別分布: 男性 89 人、女性 113 人; 年齢分布: 18~30 歳 165 人、31~45 歳 32 人、46~60 歳 5 人"},{"title":"収集環境","desc":"収集環境","content":"屋内の自然光シーン、屋内の蛍光灯シーン"},{"title":"データの多様性","desc":"データの多様性","content":"さまざまなシーン、さまざまな年齢、さまざまな撮影アングルをカバーします"},{"title":"収集設備","desc":"収集設備","content":"スマホ、ビデオ解像度は1,920*1,080"},{"title":"収集アングル","desc":"収集アングル","content":"同時に、正面顔、左顔3角度、右顔3角度、仰視、俯瞰、左側下を向く、右側下を向く、左側上を向く、右側上を向くの13角度の音声とビデオのデータを収集します。"},{"title":"録音内容","desc":"録音内容","content":"汎用分野、内容制限なし"},{"title":"言語","desc":"言語","content":"中国語普通語、各ビデオの長さは20秒以上です"},{"title":"データフォーマット","desc":"データフォーマット","content":"ビデオ形式は.mp4、オーディオは16KHz、16ビット以上、フレームレートは25~30fpsです。"},{"title":"正確率","desc":"正確率","content":"文字の正確率95%"}],"datatag":"Lip multimodal,Mandarin Chinese,Multiple scenes,Different ages,Different shooting angles","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/002_male_29.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/002_male_29.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ALASNNOKRu%2FsdItuxWu7btO8Gqs%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/001_female_30.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/001_female_30.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=mZRLnTYk5W0s3jRzP7Um81hhRvw%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/156_male_42.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/156_male_42.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2wVvKW6e6XgkYOi9kPqptswFKGs%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"202人のマルチアングル唇形状マルチモーダルビデオデータは、屋内の自然光シーンと屋内の蛍光灯シーンという収集環境で収集されました。収集設備は携帯電話です。収集の多様性は、さまざまなシーン、さまざまな年齢、13 の撮影アングルをカバーしています。使用される言語は中国語普通語です。録音は汎用分野であり、内容は制限されません。このデータは、音声と画像の分野におけるマルチモーダル学習アルゴリズムの研究に使用できます。","dataexampl":null,"datakeyword":["マルチアングル","唇形状マルチモーダル","室内自然光シーン","室内蛍光灯シーン","13撮影アングル","中国語普通語","汎用分野"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/090_female_38.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/090_female_38.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=c6Jkb362VMrtxemlPNPSW%2FkEH%2Fk%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/002_male_29.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ALASNNOKRu%2FsdItuxWu7btO8Gqs%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/001_female_30.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=mZRLnTYk5W0s3jRzP7Um81hhRvw%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/156_male_42.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=2wVvKW6e6XgkYOi9kPqptswFKGs%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230627001_demo1715767204254/APY230627001_demo/090_female_38.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=c6Jkb362VMrtxemlPNPSW%2FkEH%2Fk%3D"}]
202人のマルチアングル唇形状マルチモーダルビデオデータ
マルチアングル
唇形状マルチモーダル
室内自然光シーン
室内蛍光灯シーン
13撮影アングル
中国語普通語
汎用分野
202人のマルチアングル唇形状マルチモーダルビデオデータは、屋内の自然光シーンと屋内の蛍光灯シーンという収集環境で収集されました。収集設備は携帯電話です。収集の多様性は、さまざまなシーン、さまざまな年齢、13 の撮影アングルをカバーしています。使用される言語は中国語普通語です。録音は汎用分野であり、内容は制限されません。このデータは、音声と画像の分野におけるマルチモーダル学習アルゴリズムの研究に使用できます。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データ規模
202人がそれぞれ13本の異なるアングルのオーディオとビデオと1本のTXT文書を収集します
人物属性
人種分布: 黄色(インドネシア人); 性別分布: 男性 89 人、女性 113 人; 年齢分布: 18~30 歳 165 人、31~45 歳 32 人、46~60 歳 5 人
データの多様性
さまざまなシーン、さまざまな年齢、さまざまな撮影アングルをカバーします
収集設備
スマホ、ビデオ解像度は1,920*1,080
収集アングル
同時に、正面顔、左顔3角度、右顔3角度、仰視、俯瞰、左側下を向く、右側下を向く、左側上を向く、右側上を向くの13角度の音声とビデオのデータを収集します。
データフォーマット
ビデオ形式は.mp4、オーディオは16KHz、16ビット以上、フレームレートは25~30fpsです。
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
3053196c-51ae-4ca2-9b30-b09ce62d73ea