jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

LLMデータセット

既製の高品質データセットでAIモデルのパフォーマンスを即座に向上させます。

タイプ

全て
19
画像キャプション
10
SFTデータセット
1
事前学習向けテキスト
8

1.3億問の小学から大学中国語試験問題テキストデータ

1.3億問の小学から大学中国語試験問題テキストデータ、K12試験データ総量2,087万問(うち解説付き1,600万問)、大学及び職業試験データ総量1.17億問(うち解説付き700万問);K12試験データはデータ品質レベル、試験ポイント、内容タイプ、問題形式、学段、問題難易度、学年、科目、試験ソース、解答、解説などのフィールドを含む;大学及び職業試験データは解答、解説、カテゴリなどのフィールドを含む;K12試験データの学段は小学、初中、高中で、科目は国語、数学、英語、歴史、地理、政治、生物、物理、化学、科学を含む;大学及び職業試験データの領域は公安、公務員試験、医学、外国語、学歴、工学、教育、法律、経済、職業、コンピュータ、資格、金融など;問題形式は多肢選択問題、単一選択問題、正誤問題、空欄補充問題など;このデータは大規模モデルの学科知識強化タスクに使用可能。
専門問題 テキスト LLM

150万問の韓国語試験問題構造化解析処理データ

韓国語試験問題の構造化解析処理データ、試験問題総数は約150万問。各問題は問題タイプ、問題文、解答、解析などのフィールドを含む。科目は【小学校】国語、数学、英語、社会、科学;【中学校】国語、英語、数学、科学、社会;【高校】国語、英語、数学、物理、化学、生物、歴史、地理を含む。問題タイプは選択問題、空欄補充問題、正誤問題、記述問題など。このデータは大規模モデルの学科知識強化タスクに利用可能。
K12問題 テキスト LLM 韓国語

25万件の英語動物医療データ

英語動物医療データ、多種の動物の医療検査結果、治療詳細、処方、アレルギーテスト、ワクチン接種履歴などを含み、さまざまな人工知能アプリケーションに豊富なリソースを提供します。複数のAI企業による検証により、モデルが実世界の多様性に対応するのに役立つことが確認されています。データ保護法規とプライバシー規定を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと法的権利を保護します。すべてのデータはGDPR、CCPA、PIPLに準拠しています。
医療レポート 動物 ペット

1.4億件の中国語裁判文書テキストデータ

本データは1998年から2023年12月までの期間にわたる1億4千万件の法律裁判文書が含まれており、各裁判文書は細かい粒度で構造化解析が行われています(データフォーマットはjsonで、フィールドには案件名、裁判所名、文書タイプ、案件タイプ、案由、当事者、裁判日、文書内容を構成する各部分などが含まれます。裁判文書の全文内容はs22からs28に解析されています)。また、詳細なデータ辞書説明ファイルも提供されています。
判決文書 テキスト LLM(大規模言語モデル)

21,998件の車両属性画像記述データ

21,998 台の車両属性画像記述データは、セダン、SUV、MPV、トラック、バスなど、さまざまな車種をカバーしています。監視カメラを使用して、複数の期間の屋外道路のデータを収集しました。画像には、主に車種、色、車両の方向、シーンなどの情報が記述されています。記述言語は英語です。
マルチモダリティ 車両属性データ セキュリティデータ インテリジェントな監視データ インテリジェントな交通データ インテリジェントな都市データ

100万組の汎用シーン画像説明データ(詳細説明)

100万組の画像と説明、画像タイプは風景、動物、花木、人物、車、スポーツ、工業、建築など多種のカテゴリと美学サブセットを含み、画像全体のシーン、シーン内の詳細、および画像が表現する感情を説明します。説明言語は英語と中国語の2言語です。
テキスト説明 マルチモーダル 汎用シーンデータセット 英語キャプション 中国語キャプション

10,000枚のシーン画像記述データ

10,000枚のシーンの画像記述データには、自然風景、都市の街頭風景、展示会、家庭環境などのシーンが含まれます。さまざまなブランドのカメラで撮影され、複数の時期と撮影角度をカバーしています。記述言語は英語です。主に画像の主なシーンを記述し、通常は前景と背景の記述が含まれます。
マルチモダリティ 自然シーンデータセット シーン情報データ

10,100件の顔画像記述データ

10,100枚の顔画像記述データには、18歳未満、18~45歳、46~60歳、60歳以上の複数の多人種が含まれています。収集シーンは豊富で、室内と屋外のシーンが含まれています。画像コンテンツは豊富で、マスク、メガネ、ヘッドフォンの着用、表情、姿勢、敵対サンプルが含まれています。テキスト記述言語は英語で、主に人種、性別、年齢、撮影角度、照明、多様性の内容が記述されています。
マルチモード マルチポーズ顔画像データ 顔データセット

11,000セットの人間の行動画像と動画の記述データ

11,000セットの人間行動画像およびビデオ記述データには 10,000 枚の画像と 10,000 本のビデオが含まれており、屋内や屋外のシーンを含むさまざまな季節や撮影角度でのさまざまな人間行動を捉えています。記述言語は英語で、主にキャラクターの性別、年齢、服装、行動説明、体の動きなどを記述します。
AIGC 人間行動データ 行動認識データ 人間行動認識データ 人間認識データ

loading

今すぐデータをカスタマイズ

既製データセットの強み

  • 著作権あり

    著作権あり

    自社版権で すぐ納品可能
  • 安全

    安全

    承認済み 安全で使用可能
  • 専門性高い

    専門性高い

    AIデータの専門家により 設計・作成
  • 多様性に富む

    多様性に富む

    様々な 実際のシーンから収集
  • コスパ高い

    コスパ高い

    カスタマイズより コスパが優れている
  • 効率的

    効率的

    即座に 納品可能
1d0cf0d0-ae86-4ef3-a864-296f3e919512