「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

10万対の中国語大規模モデル汎用領域複雑指示追従SFTテキストデータセット

LLM
指示追従
SFT

10万対の中国語複雑なprompt指示、文字数は50~400字、各promptには3つ以上の制約条件を含み、大規模モデルの指示追従性を向上させるためのトレーニングに使用。カテゴリカバレッジは生成類(ニュース記事作成、インタビューアウトライン、コピーライティング、原稿校正、中英作文、文法学習、研究レポート、学習計画、詩創作、美食紹介、広告ソフト文、セールストーク、公文書補助作成、公文書審査、政策文書QAなど)、リライト類(文書き換え、テキスト校正、文結合、文案簡略化)、要約類(内容要約)、抽出類(イベント要素抽出、意見抽出、キーワード抽出、立場抽出、エンティティ抽出)。全てのpromptは手動で作成され、多様性をカバー。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
データ量
10万
データ用途
大規模モデルの指示追従性を向上させるためのトレーニングに使用
データ内容
多様な複雑なprompt指示、文字数は50~400字、各promptには3つ以上の制約条件を含む
カテゴリカバレッジ
生成類(ニュース記事作成、インタビューアウトライン、コピーライティング、原稿校正、中英作文、文法学習、研究レポート、学習計画、詩創作、美食紹介、広告ソフト文、セールストーク、公文書補助作成、公文書審査、政策文書QAなど)、リライト類(文書き換え、テキスト校正、文結合、文案簡略化)、要約類(内容要約)、抽出類(イベント要素抽出、意見抽出、キーワード抽出、立場抽出、エンティティ抽出)
制作方式
全てのpromptは手動で作成され、多様性をカバー
言語
中国語
サンプル サンプル
  • 10万対の中国語大規模モデル汎用領域複雑指示追従SFTテキストデータセット
  • 10万対の中国語大規模モデル汎用領域複雑指示追従SFTテキストデータセット
  • 10万対の中国語大規模モデル汎用領域複雑指示追従SFTテキストデータセット
おすすめデータセットおすすめデータセット
ご要望をご相談ください

プライバシー保護 に同意する

よくあるご質問

大規模言語モデル学習用としてどのような分類・構造化データがありますか?

Nexdata の LLM データセットには、指示追従型(SFT)、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか?

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか?カスタマイズは可能ですか?

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。

5dd1e1f3-d6d2-4252-990e-fb7b6009fb46

1904f012-3815-4e35-959f-31c46e80fe46