jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

202人のマルチアングル唇形状マルチモーダルビデオデータ

マルチアングル
唇形状マルチモーダル
室内自然光シーン
室内蛍光灯シーン
13撮影アングル
中国語普通語
汎用分野

202人のマルチアングル唇形状マルチモーダルビデオデータは、屋内の自然光シーンと屋内の蛍光灯シーンという収集環境で収集されました。収集設備は携帯電話です。収集の多様性は、さまざまなシーン、さまざまな年齢、13 の撮影アングルをカバーしています。使用される言語は中国語普通語です。録音は汎用分野であり、内容は制限されません。このデータは、音声と画像の分野におけるマルチモーダル学習アルゴリズムの研究に使用できます。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
データ規模
202人がそれぞれ13本の異なるアングルのオーディオとビデオと1本のTXT文書を収集します
人物属性
人種分布: 黄色(インドネシア人); 性別分布: 男性 89 人、女性 113 人; 年齢分布: 18~30 歳 165 人、31~45 歳 32 人、46~60 歳 5 人
収集環境
屋内の自然光シーン、屋内の蛍光灯シーン
データの多様性
さまざまなシーン、さまざまな年齢、さまざまな撮影アングルをカバーします
収集設備
スマホ、ビデオ解像度は1,920*1,080
収集アングル
同時に、正面顔、左顔3角度、右顔3角度、仰視、俯瞰、左側下を向く、右側下を向く、左側上を向く、右側上を向くの13角度の音声とビデオのデータを収集します。
録音内容
汎用分野、内容制限なし
言語
中国語普通語、各ビデオの長さは20秒以上です
データフォーマット
ビデオ形式は.mp4、オーディオは16KHz、16ビット以上、フレームレートは25~30fpsです。
正確率
文字の正確率95%
サンプル サンプル
  • 202人のマルチアングル唇形状マルチモーダルビデオデータ
  • 202人のマルチアングル唇形状マルチモーダルビデオデータ
  • 202人のマルチアングル唇形状マルチモーダルビデオデータ
おすすめデータセットおすすめデータセット
ご要望をご相談ください

プライバシー保護 に同意する

257490bb-8503-47fc-804d-9d36c29af573

3053196c-51ae-4ca2-9b30-b09ce62d73ea