「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

700万組の高品質ビデオ説明データ

マルチモーダル
ビデオ
説明
キャプション
LLMデータセット

700万本のグローバル正版高品質ビデオ。全てグローバル写真家が公開した正版ビデオ作品。うち600万本は英語説明、100万本は中国語説明。人物、風景、動物など多種のカテゴリをカバー。解像度は全て1080p以上。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
データ規模
700万本のグローバル正版高品質ビデオ(人をテーマにしたビデオは200万本以上)、うち600万本は英語説明、100万本は中国語説明
データ内容
グローバル作者が公開した正版ビデオ作品及び作者が作成した説明とタグリスト
ビデオタイプ
人物、風景、動物など多種のカテゴリをカバー
ビデオ解像度
1,080p以上
データフォーマット
.mp4、.mov、.aviなどの一般的なフォーマット;.xlsx(アノテーションファイルフォーマット)
ビデオ時間
全て1分以内、うち10-30秒が80%、5-10秒が15%
テキスト説明長
全て短い説明、0-20字/単語が約98%
サンプル サンプル
おすすめデータセットおすすめデータセット
ご要望をご相談ください

プライバシー保護 に同意する

よくあるご質問

大規模言語モデル学習用としてどのような分類・構造化データがありますか?

Nexdata の LLM データセットには、指示追従型(SFT)、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか?

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか?カスタマイズは可能ですか?

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。

30610055-ed68-425a-ad1b-5107260c2fb4

7246243c-dddf-478f-9582-e3d4f224c453