jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

自然言語理解
データセット

既製の高品質データセットでAIモデルのパフォーマンスを
即座に向上させます。

タイプ

全て
31
エンティティ認識
2
対話テキスト
1
意図の理解
5
その他
2
対訳コーパス
22

84516文-インタラクティブシーンにおける英語意図アノテーションデータ

英文意図識別データの総規模は84516文あり、意図類の表示は、スロット位置とスロット値情報を含む、意図分野には音楽、天気、日付、日程、家庭設備類などが含まれている。意図認識などの関連分野の研究に用いることができる。
英語意図表示データ インタラクティブ意図表示データ 意図認識 nlp意図認識データ NLUデータ

85万組の英語・日本語平行コーパスデータセット

85万組の英語・日本語対訳コーパスデータセット。データ保存形式はtxt形式で、旅行、医療、日常会話、ニュースなど多岐にわたる分野をカバーしています。データクレンジング、匿名化処理、品質検査済み。テキストデータ分析の基礎コーパスとして、機械翻訳などの分野に活用できます。
英日平行コーパスデータ 英日平行コーパス 英日平行コーパス 平行コーパスデータ アラインメントコーパスデータ

8012万組の中英並列コーパスデータ

中英並列コーパスは、テキスト(.txt)フォーマットで保存されたメモリデータで、観光・医療・日常会話、及びテレビドラマなど多分野に幅広く活用されています。また、データの前処理済みで、テキストデータ分析の基盤コーパスとして、機械翻訳などの分野にも活用されています。
中英並列コーパスデータ 中英アライメント コーパス

和英平行コーパスデータ38組

和英平行コーパスデータ合計38万組。政治、わいせつ、個人情報等の禁止ワードを排除し、テキストデータ分析用の基盤コーパスとして、MT等の分野に活用可能。
英和の平行コーパスデータ 英和の平行コーパス収集 アライメントコーパス 平行コーパスデータ アライメントコーパスデータ

687,694文のオープンドメイン意図アノテーションデータ

オープンドメイン意図アノテーションデータは、687,694件のユーザーがスマートフォンシーンで実際に生成したテキスト内容をアノテーションし、タスクシーン、場所シーン、スケジュールシーンをカバー。自然言語理解などのタスクに利用可能。
オープンドメインデータ 意図アノテーションデータ テキストデータアノテーション SMSテキストデータ NLUデータ 意図理解データ

47,811文インタラクティブシーン単文意図マークアップデータ

インタラクションシーン単文意図マークアップデータ、そのデータ規模は47811文であり、意図クラスのマークアップを行い、スロット位置とスロット値情報を含む、意図領域には音楽、天気、日付、スケジュール、家庭設備類などが含まれます。このデータは意図認識などの関連分野の研究に利用することができますます。
意図アノテーションデータ インタラクティブ意図アノテーションデータ 意図認識 nlp意図認識データ NLUデータ

自動車フォーラム投稿細粒度アノテーションデータ56,920条

合計56,920件の細粒度な自動車レビューアノテーションデータは、様々な自動車フォーラムのコメント内容を収集し、その中でユーザーのコメント投稿に対して細粒度なアノテーションを行います。アノテーションの対象は、メーカー、ブランド、車型、属性、ディスクリプション値、傾向性などが含まれます。本細粒度自動車レビューアノテーションデータは、細粒度自然言語理解研究や感情分析などの分野に活用可能。
細粒度の車コメントアノテーションデータ 車コメントデータアノテーション テキストデータ収集 NLUデータ

5310000組―中国語、ドイツ語並列コーパスデータ

514万対の文-中国語、ドイツ語並列コーパスデータをテキスト形式で格納します。観光、医療、日常生活、ニュースなど多くの分野をカバーしています。データクレンジング脱感質検査を行い、機械翻訳などの分野のテキストデータ解析の基本コーパスとして使用できます。
中国語-ドイツ語平行コーパスデータ 中国語-ドイツ語平行コーパス 平行コーパスデータ 整列コーパスデータ

75個の中国語領域の辞書データ

75個の中国語領域の辞書は特定の一年ののデータを収集したもので、幅広い内容をカバーします。データーファイルの中では行に語彙項目一つとその発音を含み、各語彙項目がアルファベットの順でソートされています。該当データーが自然言語の理解や知識構築などのタスクに使用することができます。
中国語領域の辞書データ テキストデータ NLUデータ エンティティ識別データ

loading

今すぐデータをカスタマイズ

既製データセットの強み

  • 著作権あり

    著作権あり

    自社版権で すぐ納品可能
  • 安全

    安全

    承認済み 安全で使用可能
  • 専門性高い

    専門性高い

    AIデータの専門家により 設計・作成
  • 多様性に富む

    多様性に富む

    様々な 実際のシーンから収集
  • コスパ高い

    コスパ高い

    カスタマイズより コスパが優れている
  • 効率的

    効率的

    即座に 納品可能
f752e678-e027-4f17-a4c9-3948c22a1c1d