[{"@type":"PropertyValue","name":"データ量","value":"10万"},{"@type":"PropertyValue","name":"データ用途","value":"大規模モデルの指示追従性を向上させるためのトレーニングに使用"},{"@type":"PropertyValue","name":"データ内容","value":"多様な複雑なprompt指示、文字数は50~400字、各promptには3つ以上の制約条件を含む"},{"@type":"PropertyValue","name":"カテゴリカバレッジ","value":"生成類(ニュース記事作成、インタビューアウトライン、コピーライティング、原稿校正、中英作文、文法学習、研究レポート、学習計画、詩創作、美食紹介、広告ソフト文、セールストーク、公文書補助作成、公文書審査、政策文書QAなど)、リライト類(文書き換え、テキスト校正、文結合、文案簡略化)、要約類(内容要約)、抽出類(イベント要素抽出、意見抽出、キーワード抽出、立場抽出、エンティティ抽出)"},{"@type":"PropertyValue","name":"制作方式","value":"全てのpromptは手動で作成され、多様性をカバー"},{"@type":"PropertyValue","name":"言語","value":"中国語"}]
{"id":1456,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"228","type2str":null,"dataname":"10万対の中国語大規模モデル汎用領域複雑指示追従SFTテキストデータセット","datazy":[{"title":"データ量","desc":"データ量","content":"10万"},{"title":"データ用途","desc":"データ用途","content":"大規模モデルの指示追従性を向上させるためのトレーニングに使用"},{"title":"データ内容","desc":"データ内容","content":"多様な複雑なprompt指示、文字数は50~400字、各promptには3つ以上の制約条件を含む"},{"title":"カテゴリカバレッジ","desc":"カテゴリカバレッジ","content":"生成類(ニュース記事作成、インタビューアウトライン、コピーライティング、原稿校正、中英作文、文法学習、研究レポート、学習計画、詩創作、美食紹介、広告ソフト文、セールストーク、公文書補助作成、公文書審査、政策文書QAなど)、リライト類(文書き換え、テキスト校正、文結合、文案簡略化)、要約類(内容要約)、抽出類(イベント要素抽出、意見抽出、キーワード抽出、立場抽出、エンティティ抽出)"},{"title":"制作方式","desc":"制作方式","content":"全てのpromptは手動で作成され、多様性をカバー"},{"title":"言語","desc":"言語","content":"中国語"}],"datatag":"LLM,Instruction-Following,SFT","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[],"officialSummary":"10万対の中国語複雑なprompt指示、文字数は50~400字、各promptには3つ以上の制約条件を含み、大規模モデルの指示追従性を向上させるためのトレーニングに使用。カテゴリカバレッジは生成類(ニュース記事作成、インタビューアウトライン、コピーライティング、原稿校正、中英作文、文法学習、研究レポート、学習計画、詩創作、美食紹介、広告ソフト文、セールストーク、公文書補助作成、公文書審査、政策文書QAなど)、リライト類(文書き換え、テキスト校正、文結合、文案簡略化)、要約類(内容要約)、抽出類(イベント要素抽出、意見抽出、キーワード抽出、立場抽出、エンティティ抽出)。全てのpromptは手動で作成され、多様性をカバー。","dataexampl":null,"datakeyword":["LLM"," 指示追従"," SFT"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp
[]
10万対の中国語大規模モデル汎用領域複雑指示追従SFTテキストデータセット
LLM
指示追従
SFT
10万対の中国語複雑なprompt指示、文字数は50~400字、各promptには3つ以上の制約条件を含み、大規模モデルの指示追従性を向上させるためのトレーニングに使用。カテゴリカバレッジは生成類(ニュース記事作成、インタビューアウトライン、コピーライティング、原稿校正、中英作文、文法学習、研究レポート、学習計画、詩創作、美食紹介、広告ソフト文、セールストーク、公文書補助作成、公文書審査、政策文書QAなど)、リライト類(文書き換え、テキスト校正、文結合、文案簡略化)、要約類(内容要約)、抽出類(イベント要素抽出、意見抽出、キーワード抽出、立場抽出、エンティティ抽出)。全てのpromptは手動で作成され、多様性をカバー。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データ用途
大規模モデルの指示追従性を向上させるためのトレーニングに使用
データ内容
多様な複雑なprompt指示、文字数は50~400字、各promptには3つ以上の制約条件を含む
カテゴリカバレッジ
生成類(ニュース記事作成、インタビューアウトライン、コピーライティング、原稿校正、中英作文、文法学習、研究レポート、学習計画、詩創作、美食紹介、広告ソフト文、セールストーク、公文書補助作成、公文書審査、政策文書QAなど)、リライト類(文書き換え、テキスト校正、文結合、文案簡略化)、要約類(内容要約)、抽出類(イベント要素抽出、意見抽出、キーワード抽出、立場抽出、エンティティ抽出)
制作方式
全てのpromptは手動で作成され、多様性をカバー
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
8109dd1b-ee44-4fe3-a8aa-ca6157d4794f