「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

世界のAI大手企業、ベンチャー企業・スタートアップ、大学研究機関から信頼されます。

  • ZOOM
  • SoundHound
  • NCsoft
  • MZ
  • seoul national university
  • iFLYTEK
  • AWS
  • UBTECH
  • ICBC
  • CISCO
  • Google
  • Meta
  • Tencent
  • Lenovo

チャットボット向け
カスタマイズサービス

Nexdataは、言語、音色、スタイル、業種に応じてカスタマイズされたカスタマーサービスの音声データ収集をサポートし、膨大な生データの情報抽出、分類、アノテーションなどのデータ処理を提供します。

多言語

多言語

アクセントのある英語、コード切り替え、中国語の方言などでの音声データ収集をサポートしています。

多領域

マルチドメイン

金融、保険、電子商取引などのさまざまな業種のカスタマーサービス音声データ収集をサポートします。

音声分割

音声セグメンテーション

長いオーディオデータ、ノイズ、有効/無効なオーディオデータの分割アノテーションを行います。

音声アノテーション

音声アノテーション

長短の自然音声の複数段落にまたがる書き起こしアノテーションをサポートします。

感情アノテーション

感情アノテーション

音声に含まれるスピーカーの感情情報に対してポジティブ、ネガティブのアノテーションを行います。

コンプライアンスと
セキュリティ

Nexdataは、データセキュリティと顧客の信頼を最大限に重視しています。当社は個人情報保護法、GDPR、CCPA、PIPC、HIPAA規制に従っています。また、セキュリティと規制遵守のためにISO 27001、ISO 27701、ISO 9001の資格を取得しています。Nexdataは卓越したデータセキュリティを提供し、様々な国際的標準を遵守することで顧客の信頼を得ています。

GDPR
GDPR
CCPA
CCPA
SOC2
SOC2
ISO27701
ISO27701
ISO27001
ISO27001
ISO9001
ISO9001

Nexdataにより
迅速に信頼性高いAIを導入

Nexdataは、パイプラインによるアノテーションワークフローのコントロールを徹底しています。
AIプロジェクトを5倍スピードアップします。

ケーススタディ

音声認識会話AI
  • 事例:日本語音声認識データセット提供
  • 課題:お客様は、日本語に特化した音声認識モデルの精度向上向けに、学習用の日本語音声データセットが必要としています。
  • ソリューション:Nexdataは、既存の800時間に及ぶ日本語会話データを二週間という短期間で提供しました。日本各都道府県占める3,000人以上の日本人により、多種類豊富な内容を収録しています。
標準中国語カスタマーサービス向け音声認識
  • 事例:カスタマーサービス音声認識データ収集・アノテーション
  • 課題:お客様はインテリジェントなカスタマーサービス向けの音声認識技術をゼロから開発しており、高品質な多言語データセットの不足に直面していました。特に日本語のニュアンスや多国話者のアクセントに対応できるデータが緊急に必要でした。
  • ソリューション:Nexdataは、500時間の日本語と1,000時間の多国話者英語の高精度データセットを提供し、さらに専門的なアノテーションでリアルな利用シーンを再現しました。その結果、お客様はわずか1カ月でスマートカスタマーサービスをオンライン化することに成功しました。
チャットボット知識ベース最適化
  • 事例:チャットボット知識ベースの最適化。
  • 課題:お客様はアプリのカスタマーサービスのナレッジバンクを最適化してサービスの質を向上することを希望していました
  • ソリューション:Nexdataはお客様の新たなナレッジポイントの拡充と最適化を実施、類似の質問の削除や追加、最適化を行いました。約23万件のナレッジポイントの編集し、各ナレッジポイントについて、少なくとも30件の類似質問を拡充しました。
Nexdataデータアノテーション無料トライアル

音声、画像、ビデオ、点群、テキストデータなどあらゆるアノテーションに対応。

おすすめデータセット

205時間話者分離日本語自然会話音声データセット

本データは、フルデュプレックス(全二重)対話を前提に収録した高品質な日本語音声データセットです。有効時間205時間。半二重方式では再現が難しい同時発話や重なり発話、自然な相槌や割込みを含み、双方向に同時進行する対話を再現した同時双方向音声データセットとして、リアルタイム対話AIや次世代ASRの研究開発に適しています。そして、本セットは提示されたトピックリストから収録者が複数の得意分野を選択し、自然な流れで会話を展開して収録した日本語自然会話音声データセットです。日本各地のネイティブ話者による多様な対話を含み、高音質収録によりASRの音響・言語モデル学習、声紋識別、対話システム評価など幅広い研究用途に活用できます。データは各種プライバシー保護規制に準拠して管理されています。 当社の全二重音声データセットシリーズは、日本語をはじめ、英語、韓国語など多言語に対応し、書き起こしテキスト、発話タイムスタンプ、話者ID、性別などの詳細アノテーションを標準搭載しています。また、話者ごとの独立音声を含む話者分離音声データセットとしても利用可能で、収録条件や話者属性、ラベル仕様のカスタマイズ収集・作成にも柔軟に対応します。

日本語音声データ 話者分離音声データ 全二重音声データセット 同時双方向音声データセット 日本語自然会話音声データ

2人日本語音声合成データセット

本製品は、音声合成(TTS)、音声認識(ASR)、および機械学習モデルの開発用に設計された、高品質な日本語音声合成データセットです。日本ネイティブ話者によって録音されて、深層学習や生成 AIの研究開発ニーズに精准にマッチします。商用利用可能な学習データとして、仮想アシスタントやナビゲーションシステムなど幅広い用途に対応しています。技術仕様としては、サンプリングレート48kHz、24bit、WAV 形式の高音質オーディオを提供し、音素バランスが均等にカバーされているため頑健なモデル訓練を保証します。専門の言語学者により精度高くアノテーションされており、時間軸付きトランスクリプト(JSON, TextGrid, CSV 形式)が付属。句読点と文の境界も明確化されており、音声 AI のファインチューニングや本番環境でのデプロイに必要な基礎品質を備えています。権利関係とコンプライアンス面では、商用利用および研究利用における著作権はクリア済みで、話者が使用契約書に署名済みです。GDPR および CCPA 準拠であり、個人識別情報も適切に管理されています。即時ダウンロード可能で、スタートアップ様から大企業様まで柔軟に提供可能です。音声データ収集のカスタム要件や見積もりのご希望も、お気軽にお問い合わせください。

日本人日本語音声合成データセット 標準日本語音声データセット 日本語音声合成コーパス 日本語TTS音声データセット

10話者イギリス英語音声合成データセット

本製品は、音声合成(TTS)、音声認識(ASR)、および機械学習モデルの開発用に設計された、高品質なイギリス英語音声合成データセットです。合計20.85時間の音声を含み、イギリスのネイティブ話者によって録音されて、深層学習や生成 AI の研究開発ニーズに精准にマッチします。商用利用可能な学習データとして、仮想アシスタントやナビゲーションシステムなど幅広い用途に対応しています。技術仕様としては、サンプリングレート48kHz、24-bit、WAV 形式の高音質オーディオを提供し、音素バランスが均等にカバーされているため頑健なモデル訓練を保証します。専門の言語学者により精度高くアノテーションされており、時間軸付きトランスクリプトが付属。句読点と文の境界も明確化されており、音声 AI のファインチューニングや本番環境でのデプロイに必要な基礎品質を備えています。権利関係とコンプライアンス面では、商用利用および研究利用における著作権はクリア済みで、話者が使用契約書に署名済みです。GDPR および CCPA 準拠であり、個人識別情報も適切に管理されています。即時ダウンロード可能で、スタートアップ様から大企業様まで柔軟に提供可能です。音声データ収集のカスタム要件や見積もりのご希望も、お気軽にお問い合わせください。

イギリス英語音声コーパス 英語音声合成TTSコーパス イギリス英語音声合成データセット 英語音声合成データセット

19.46時間アメリカ英語音声合成データセット-女性

アメリカ英語の女性音声合成データセットは、ネイティブならではの自然でクリアな発音と、親しみやすく柔らかな音色が特長です。合計⒚.46時間の音声を含み、アメリカのネイティブ話者によって録音されて、深層学習や生成AIの研究開発ニーズに精准にマッチします。商用利用可能な学習データとして、仮想アシスタントやナビゲーションシステムなど幅広い用途に対応しています。技術仕様としては、サンプリングレート48kHz、24-bit、WAV 形式の高音質オーディオを提供し、音素バランスが均等にカバーされているため頑健なモデル訓練を保証します。専門の言語学者により精度高くアノテーションされており、時間軸付きトランスクリプトが付属。句読点と文の境界も明確化されており、音声AIのファインチューニングや本番環境でのデプロイに必要な基礎品質を備えています。権利関係とコンプライアンス面では、商用利用および研究利用における著作権はクリア済みで、話者が使用契約書に署名済みです。GDPR および CCPA 準拠であり、個人識別情報も適切に管理されています。即時ダウンロード可能で、スタートアップ様から大企業様まで柔軟に提供可能です。音声データ収集のカスタム要件や見積もりのご希望も、お気軽にお問い合わせください。"

アメリカ英語音声合成コーパス TTS英語音声データセット アメリカ英語音声合成データセット 英語音声合成データセット

Nexdataが選ばれる理由

ワンストップデータサービス

ワンストップデータサービス

Nexdata.aiは、幅広いデータ
アノテーションと収集サービスを提供し
お客様のAIプロジェクトを成功に導きます。

データQAシステム

データQAシステム

Nexdataは、インテリジェントな自己検査、
複数の品質チェックとISO9001認証により、
高品質なデータをお届けします。

豊富なアノテーションツール

豊富なアノテーションツール

30種類の実績あるアノテーションツール
音声、画像、ビデオ、3D点群、テキストなど
データアノテーションの要件を完全にカバーします。

コンプライアンスとセキュリティ

コンプライアンスとセキュリティ

個人情報保護法、
GDPR、ISO27001/ISO27701
に準拠しています。

AIによる事前認識

AIによる事前認識

AIによる事前認識機能により、
人間とコンピュータの協同による
半自動アノテーションを実現します。

カスタマイズデータソリューションの詳細

d478784e-705e-42b0-8d2f-5de7f0a5bda8