「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

世界のAI大手企業、ベンチャー企業・スタートアップ、大学研究機関から信頼されます。

  • NVIDIA
  • Microsoft
  • Intel
  • APTIV
  • Qualcomm
  • SAMSUNG
  • BOSCH
  • General Motors
  • Tencent
  • AWS
  • Google
  • Cerence
  • Deepmotion
  • Meta

人気のデータセット

すぐに使える最新のデータセットにアクセスし、ビジネスの成長を促進しましょう。

205時間話者分離日本語自然会話音声データセット

本データは、フルデュプレックス(全二重)対話を前提に収録した高品質な日本語音声データセットです。有効時間205時間。半二重方式では再現が難しい同時発話や重なり発話、自然な相槌や割込みを含み、双方向に同時進行する対話を再現した同時双方向音声データセットとして、リアルタイム対話AIや次世代ASRの研究開発に適しています。そして、本セットは提示されたトピックリストから収録者が複数の得意分野を選択し、自然な流れで会話を展開して収録した日本語自然会話音声データセットです。日本各地のネイティブ話者による多様な対話を含み、高音質収録によりASRの音響・言語モデル学習、声紋識別、対話システム評価など幅広い研究用途に活用できます。データは各種プライバシー保護規制に準拠して管理されています。 当社の全二重音声データセットシリーズは、日本語をはじめ、英語、韓国語など多言語に対応し、書き起こしテキスト、発話タイムスタンプ、話者ID、性別などの詳細アノテーションを標準搭載しています。また、話者ごとの独立音声を含む話者分離音声データセットとしても利用可能で、収録条件や話者属性、ラベル仕様のカスタマイズ収集・作成にも柔軟に対応します。

日本語音声データ 話者分離音声データ 全二重音声データセット 同時双方向音声データセット 日本語自然会話音声データ
テキストデータサービス 動画データサービス 画像データサービス 音声データサービス

データサービス

Nexdataはグローバルなデータ処理工場とプロのアノテーターを20,000人以上整備しており、音声、画像、ビデオ、点群、テキストなどのオンデマンドデータアノテーションサービスをサポートしています。

プラットフォーム

独自のヒューマン・マシン・インタラクティブ半自動アノテーションプラットフォームは、より競争力のあるAI製品を構築するお手伝いをします。

3D点群アノテーションツール

3D 点群アノテーションツール

音声アノテーションツール

音声アノテーションツール

リモートセンシングアノテーションツール

リモートセンシング向けたツール

動画アノテーションツール

動画アノテーションツール

2D画像アノテーションツール

2D画像アノテーションツール

テキストアノテーションツール

テキストアノテーションツール

Nexdata アノテーションプラットフォーム Nexdata アノテーションプラットフォーム

生成AIデータサービス

当社のデータサービスは、生成AI開発の各段階におけるお客様のAIイニシアチブの成長を加速。

ファインチューニング

ヒントとアウトプットのアノテーションにより、モデル最適化のための高品質な教師ありファインチューニングデータを作成します。

人間のフィードバックによる強化学習

SFTで学習されたモデルによって生成された複数のアウトプットを、お客様が提供したルールに従って手動でランク付けしたり、多要素スコアリングをします。

レッドチーミング

悪意のある質問や有害な可能性のある質問など敵対的な攻撃を想定し、モデルの訓練と検証を行います。

ファインチューニング
自動運転向けデータサービス

Nexdataは車内センシングから車外知覚までカバーするデータを提供し、自動運転ソリューションのあらゆるニーズにお応えします。

車室内感知データセット

車室内データセット

Nexdataは1000を超える既製データセットを保有しており、すぐに納品可能です。また、頭のポーズ、視線、表情認識、ジェスチャー検出など、車内アプリケーションのためのデータカスタマイズサービスも提供しています。

LiDARデータアノテーション

3D点群データアノテーション、データ収集、プライベート導入可能なアノテーションプラットフォームなどADAS/AV向けにカスタマイズデータソリューションを提供します。

Nexdataが選ばれる理由
高品質

高品質

マルチレベル品質検査、ISO9001品質管理認証により、高品質のデータを納品します。

高効率

高効率

ヒューマンマシンインタラクションと半自動アノテーションをサポートし、一人あたりアノテーション効率を30%以上向上させます。

コンプライアンス

コンプライアンス

当社はGDPRおよびCCPAの規制に準拠しており、当社と共有されるすべてのデータを保護します。

セキュリティ

セキュリティ

データ収集、カスタマイズサービス、データプラットフォームをカバーする包括的なセキュリティ・パイプラインにより、データ・セキュリティを徹底します。

よくあるご質問

既製品データセットは無料サンプル入手可能ですか?

お客様のご要望に応じて、既製品データセットを提案しています。もちろん、データの詳細、サンプルなどご提供可能です。

既製データセットの安全対策はどうなっていますか?

全てのデータセットは弊社版権で取り扱っています。データの提供元からAIモデル・機械学習開発に使われる許可を得ています。お客様には安心してお使いいただけます。

日本語の方言音声データ収集は対応できますか?

はい。関西弁、九州弁、東北弁など、地域ごとのアクセントに対応した収集が可能です。

学術研究向けの無料データセットは提供していますか?

はい、提供しています。Nexdataでは、大学や研究機関など世界中の非営利組織を対象に、「AIデータ支援研究プログラム」を実施しています。このプログラムを通じて、コンピュータビジョンや音声認識など、さまざまな分野における高品質なトレーニングデータセットを無償で提供し、AI研究の発展をサポートしています。ご要望に応じて、既存の提供範囲外のデータセットについても、個別にご相談承ります。

最新情報

4f655539-8fe7-45ca-b87b-0b02dde4c0e8