「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

155時間リップシンク向けマルチモーダル動画データ

唇語

249名の参加者による音声および対応する唇語動画をマルチデバイスで同期録画し、パルス信号を用いて正確にアライメント補正を実現した。高精度であり、音声画像分野のマルチモーダル学習アルゴリズム研究に活用できる。複数AI企業の検証により:モデルが実世界の多様性に対し優れた性能を発揮するのに寄与できる。データ保護法規およびプライバシー規定を厳格に順守し、データ収集、保存、利用の全過程においてユーザーのプライバシーと法的権益を保護する。全てのデータはGDPR、CCPA、PIPLに準拠する。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
フォーマット
動画:MP4形式、1280×720、音声:WAV形式、16kHz、16ビットモノラル
収録環境
静かな日当たりの良い部屋を用いて昼間の屋外走行シーンを再現、信号対雑音比25~20dB
内容
日光の強さによって、大きなシーンとサブシーンに分かれる
話者
249 中国人、男女バランス取れる
角度
正面、片側顔、上向き、下向き、下向き横顔、上向き横顔の全6方向の動画を撮影し、同時に近接音声と遠隔音声を収録する
言語
中国語
活用シーン
唇の動きによる言語認識
正確率
文の正確性は95%
サンプル サンプル
おすすめデータセットおすすめデータセット
ご要望をご相談ください

プライバシー保護 に同意する

よくあるご質問

日本語の音声認識データにはどのようなバリエーションがありますか?

子どもの日常会話、モノローグ、講義、バラエティなど幅広いジャンルを含むリアルな対話音声が収録されており、話者 ID、性別、年齢、アクセントなどもアノテーションされています。

データの多様性は実際のユースケースに役立ちますか?

はい、リアルな対話と幅広い話者属性を収録しており、日本のさまざまな環境での音声認識モデルに対応可能です。

納品までのスピードはどの程度ですか?

既製データセットは最短1日で納品可能で、カスタム収集・アノテーションも迅速対応可能です。

7c45ff7f-affa-4a8d-b40c-0f90635141e8

dbef5186-d50d-4c50-b706-131473dcf2ae