「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

700,000件汎用シーン画像説明データセット

テキスト説明
マルチモーダル
汎用シーンデータセット
英語キャプション
中国語キャプション

70万件の画像と説明文から構成される。画像タイプは風景、動物、植物、人物、自動車、スポーツ、工業、建築等多岐にわたるカテゴリと美的サブセットを含まれる。各画像には少なくとも2つの説明文を付いてある(一部画像は1つのみ)。説明言語は英語と中国語である。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
データ規模
70万組の画像と説明
画像タイプ
風景、動物、花木、人物、車、スポーツ、工業、建築など多種のカテゴリと美学サブセットをカバー
データフォーマット
画像フォーマットは.jpg、テキストフォーマットは.txt
記述言語
中国語、英語
テキスト長
原則として単文は5~20字、各画像には少なくとも2つの説明を記載、各説明は1文;一部の画像は1つのみの説明
主要記述内容
画像中の主要シーンまたは顕著な特徴
正解率
正しい説明の画像比率は95%以上
サンプル サンプル
  • 700,000件汎用シーン画像説明データセット
  • 700,000件汎用シーン画像説明データセット
  • 700,000件汎用シーン画像説明データセット
おすすめデータセットおすすめデータセット
ご要望をご相談ください

プライバシー保護 に同意する

よくあるご質問

大規模言語モデル学習用としてどのような分類・構造化データがありますか?

Nexdata の LLM データセットには、指示追従型(SFT)、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか?

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか?カスタマイズは可能ですか?

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。

db734160-0ede-487c-82e4-e1e044bb9e9d

e4bccda9-04c7-4c5d-810c-a127b87b3e66