自然言語理解データセット、最良のNLUデータセット - Nexdata

「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

ホーム > 全てのデータセット > 自然言語理解データセット

タイプ

全て

27

エンティティ認識

1

意図の理解

4

対訳コーパス

22

84516文-インタラクティブシーンにおける英語意図アノテーションデータ

英文意図識別データの総規模は84516文あり、意図類の表示は、スロット位置とスロット値情報を含む、意図分野には音楽、天気、日付、日程、家庭設備類などが含まれている。意図認識などの関連分野の研究に用いることができる。

英語意図表示データインタラクティブ意図表示データ意図認識 nlp意図認識データ NLUデータ

8012万組の中英並列コーパスデータ

中英並列コーパスは、テキスト(.txt)フォーマットで保存されたメモリデータで、観光・医療・日常会話、及びテレビドラマなど多分野に幅広く活用されています。また、データの前処理済みで、テキストデータ分析の基盤コーパスとして、機械翻訳などの分野にも活用されています。

中英並列コーパスデータ中英アライメントコーパス

199万件中国語-チェコ語パラレルコーパスデータ

本データセットは199万件の中国語とチェコ語の並列翻訳コーパスを含む。データ保存形式はtxt文書。データクリーニング、匿名化処理、品質チェックは実施済みで、テキストデータ分析の基礎コーパスとして、機械翻訳等の分野に活用できる。

中国語とチェコ語のパラレルコーパスデータアライメントコーパスパラレルコーパスデータ対訳コーパス

85万組の英語・日本語平行コーパスデータセット

85万組の英語・日本語対訳コーパスデータセット。データ保存形式はtxt形式で、旅行、医療、日常会話、ニュースなど多岐にわたる分野をカバーしています。データクレンジング、匿名化処理、品質検査済み。テキストデータ分析の基礎コーパスとして、機械翻訳などの分野に活用できます。

英日平行コーパスデータ英日平行コーパス英日平行コーパス平行コーパスデータアラインメントコーパスデータ

和英平行コーパスデータ38組

和英平行コーパスデータ合計38万組。政治、わいせつ、個人情報等の禁止ワードを排除し、テキストデータ分析用の基盤コーパスとして、MT等の分野に活用可能。

英和の平行コーパスデータ英和の平行コーパス収集アライメントコーパス平行コーパスデータアライメントコーパスデータ

687,694文のオープンドメイン意図アノテーションデータ

オープンドメイン意図アノテーションデータは、687,694件のユーザーがスマートフォンシーンで実際に生成したテキスト内容をアノテーションし、タスクシーン、場所シーン、スケジュールシーンをカバー。自然言語理解などのタスクに利用可能。

オープンドメインデータ意図アノテーションデータテキストデータアノテーション SMSテキストデータ NLUデータ意図理解データ

47,811文インタラクティブシーン単文意図マークアップデータ

インタラクションシーン単文意図マークアップデータ、そのデータ規模は47811文であり、意図クラスのマークアップを行い、スロット位置とスロット値情報を含む、意図領域には音楽、天気、日付、スケジュール、家庭設備類などが含まれます。このデータは意図認識などの関連分野の研究に利用することができますます。

意図アノテーションデータインタラクティブ意図アノテーションデータ意図認識 nlp意図認識データ NLUデータ

5310000組―中国語、ドイツ語並列コーパスデータ

514万対の文-中国語、ドイツ語並列コーパスデータをテキスト形式で格納します。観光、医療、日常生活、ニュースなど多くの分野をカバーしています。データクレンジング脱感質検査を行い、機械翻訳などの分野のテキストデータ解析の基本コーパスとして使用できます。

中国語-ドイツ語平行コーパスデータ中国語-ドイツ語平行コーパス平行コーパスデータ整列コーパスデータ

1282万の中国語と韓国語の平行データコーパス

1282万セットの中国語・韓国語の平行翻訳コーパス。txt形式で保存されており、話し言葉、観光、ニュース、金融など、さまざまな分野をカバーしている。データはデータクリーニングとデセンシタイゼーションの品質検査を受けており、テキストデータ分析の基本コーパスとして、また機械翻訳などの分野でも使用できる。

中国語・韓国語平行コーパスコーパスデータアラインメントコーパス平行コーパスデータアラインメントコーパスデータ

loading

今すぐデータをカスタマイズ

既製データセットの強み

著作権あり
自社版権ですぐ納品可能
安全
承認済み安全で使用可能
専門性高い
AIデータの専門家により設計・作成
多様性に富む
様々な実際のシーンから収集
コスパ高い
カスタマイズよりコスパが優れている
効率的
即座に納品可能

ニュースレターを購読する

AI学習用データ製品: 全てのデータセット; LLMデータセット; 画像・動画データセット; 音声認識データセット; 音声合成データセット; OCRデータセット; 発音辞書データセット; 自然言語理解データセット

データサービス: 3D点群データ; ストリートビューデータ; OCRデータ; 行動識別データ; ID識別データ; 音声認識データ; 音声合成データ; マルチモーダルデータ

活用事例: エンボディドAI; 生成AI; 自動運転; 製造業; チャットボット; AR/VR; スマートホーム; リテール; ヘルスケア

企業情報: 運営会社; 資料ダウンロード; お役立ち情報; パートナー; データセキュリティ; イベント
リンク: OPENMPD; DataPlus; Datarade

プラットフォーム: プラットフォーム
コンテスト: コンテスト
リソース: オープンデータセット

より高品質なデータでより高精度なAIを構築

0362568911

[email protected]

nexdata_ai facebook

nexdata_ai twitter

nexdata_ai linkedin

nexdata_ai youtube

Copyright © 2023 NEXDATA TECHNOLOGY INC

サイドマップ利用規約

当社は、お客様のブラウジング体験を向上させ、パーソナライズされた広告やコンテンツを提供し、当社のトラフィックを分析するためにクッキーを使用します。「すべてを受け入れる」をクリックすると、クッキーの使用に同意したことになります。

b898a067-4dfa-4e27-ac89-595448242cf3