「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

1.4億件の中国語裁判文書テキストデータ

判決文書
テキスト
LLM(大規模言語モデル)

本データは1998年から2023年12月までの期間にわたる1億4千万件の法律裁判文書が含まれており、各裁判文書は細かい粒度で構造化解析が行われています(データフォーマットはjsonで、フィールドには案件名、裁判所名、文書タイプ、案件タイプ、案由、当事者、裁判日、文書内容を構成する各部分などが含まれます。裁判文書の全文内容はs22からs28に解析されています)。また、詳細なデータ辞書説明ファイルも提供されています。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
データ内容
裁判文書テキストデータ
データ規模
1億4,000万件以上
データフィールド
事件名、事件番号、訴因、裁判所名、全文、判決日などを含みます。
保存フォーマット
json
言語
中国語
データ処理
文書内容に対して細かい粒度での解析を行い、内容のクリーニングを実施しました。
サンプル サンプル
  • 1.4億件の中国語裁判文書テキストデータ
  • 1.4億件の中国語裁判文書テキストデータ
  • 1.4億件の中国語裁判文書テキストデータ
おすすめデータセットおすすめデータセット
ご要望をご相談ください

プライバシー保護 に同意する

よくあるご質問

大規模言語モデル学習用としてどのような分類・構造化データがありますか?

Nexdata の LLM データセットには、指示追従型(SFT)、試験問題、論文、画像キャプション・動画キャプションなど、多種多様なテキスト・ジャンルが含まれています。日本語以外も対応できる多言語・複数ドメインで、業界ごとの応用にも対応可能です。

日本での利用に際して、著作権やライセンスの問題はありませんか?

すべてのデータは自社版権で提供され、即時納品可能かつ安全・承認済みです。品質保証も万全で、安心してご利用いただけます。

大規模データはすぐに使えますか?カスタマイズは可能ですか?

はい、既製データセットはすぐに納品可能です。また、ニーズに応じたカスタマイズサービスも提供しており、コスパ良く効率的に導入できます。

15ba2329-759e-45f0-855a-82c66022f0cc

9db5e8ab-642c-4f2c-be26-033193bd82e7