「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

2話者オランダ語音色合成データセット

オランダ語音声合成データセット
オランダ語音声合成コーパス

本製品は、音声合成(TTS)、音声認識(ASR)、および機械学習モデルの開発用に設計された、高品質な2話者オランダ語平均音色合成ライブラリです。合計8時間の音声を含み、オランダのネイティブ話者2名(男女各1名)によって録音されており、深層学習や生成 AI の研究開発ニーズに精准にマッチします。商用利用可能な学習データとして、仮想アシスタント、スマートスピーカー、ナビゲーションシステム、言語学習アプリなど幅広い用途に対応しています。技術仕様としては、サンプリングレート48kHz、24-bit、WAV 形式の高音質オーディオを提供。オランダ語の音素バランスを均等にカバーし、標準オランダ語の発音特徴に加え、語彙・イントネーション・リズムの自然な変動も反映しているため、頑健なモデル訓練を保証します。専門の言語学者により精度高くアノテーションされており、時間軸付きトランスクリプトが付属。句読点と文の境界も明確化され、音素レベル・韻律レベルの両方でラベリング済みです。音声 AI のファインチューニングや本番環境でのデプロイに必要な基礎品質を備えています。権利関係とコンプライアンス面では、商用利用および研究利用における著作権はクリア済みで、話者全員が使用契約書に署名済みです。GDPR 準拠であり、個人識別情報も適切に管理されています。即時ダウンロード可能で、スタートアップ様から大企業様まで柔軟に提供可能です。音声データ収集のカスタム要件や見積もりのご希望も、お気軽にお問い合わせください。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
フォーマット
48kHz、24bit、WAV、モノラル
録音環境
専門録音スタジオ
録音内容
汎用ドメインおよびカスタマーサービスドメインの両方のコーパスを収録
話者
オランダ人、男性1名、女性1名
発話スタイル
カスタマーサービススタイルと汎用スタイルの2種類、各スタイル・各話者につき2時間
アノテーション特性
音素・文字レベルのアノテーション、韻律(プロソディ)アノテーション
使用機材
専門的な録音機器およびソフトウェア
言語
オランダ語
活用シーン
音声合成(TTS)
サンプル サンプル
  • Audio

    L AA1 T / M UH1 / Y UH1 / EE1 R S T / UH1 N / P R O0 . F YI1 L / F A1 N / D EE1 . Z UH0 / D R YI1 / S T UU1 . R UH0 / Z OO0 . D A1 T / Y UH1 / Z UH1 / K U1 N T / L EE1 R . UH0 / K E1 N . UH0 / OO0 . K EE1

  • Audio

    H E1 T / S T AA1 T / D OEY1 . D UH0 . L UH0 K / I1 N / H E1 T / K O0 N T . R A1 K T / B UH0 S G . R EE1 . F UH0 N / UU1 / H A1 T / B EE1 . T UH0 R / O1 P / D UH1 / K L EI1 . N UH0 / L E1 T . T UH0 R S / M OE1 . T UH0 N / L E1 T . T UH0 N

  • Audio

    T EI1 . D UH0 N S / D UH1 / V I1 N . T UH0 R . M AA0 N . D UH0 N / V O1 R D T / E1 R / O0 N T . Z E1 T . T UH0 N T / F EE1 L / S N EW1 / F UH0 R . V A1 G T / V A1 T / F OO1 R / F EE1 L / V I1 N . T UH0 R . P R E0 T / K A1 N / GG AA1 N / Z O1 R . GG UH0 N

  • Audio

    I1 N / F EI1 . T UH0 / Z EI1 N / D UH1 / K O1 S . T UH0 N / F A1 N / H E1 T / K OO1 . P UH0 N / E1 N / F E0 R . K OO1 . P UH0 N / F A1 N / GG AW1 T / B EI1 / B A1 N . K UH0 / L AA1 . GG UH0 R / D A1 N / D YI1 / F A1 N / GG UH0 . V O1 . N UH0 / GG AW1 D . H A0 N . D UH0 . L AA0 . R UH0

  • Audio

    T EI1 . D UH0 N S / H E1 T / P R OE1 . F UH0 N / F A1 N / L OO0 . K AA1 L / GG UH0 . T EE1 L . D UH0 / P R OO0 . D U1 K . T UH0 N / E0 R . F AA1 R / I1 K / D UH1 / AW0 T . H E0 N . T I0 . S I0 . T EI1 T / F A1 N / H E1 T / P L A1 T . T UH0 . L A0 N T

おすすめデータセットおすすめデータセット
10時間ペルースペイン語音声合成データセット

本製品は、音声合成(TTS)、音声認識(ASR)、および機械学習モデルの開発用に設計された、高品質なペルースペイン語音声合成データセットです。合計10時間の音声を含み、ペルーのネイティブ話者によって録音されて、深層学習や生成 AI の研究開発ニーズに精准にマッチします。商用利用可能な学習データとして、仮想アシスタントやナビゲーションシステムなど幅広い用途に対応しています。 技術仕様としては、サンプリングレート48kHz、24-bit、WAV 形式の高音質オーディオを提供し、音素バランス(Phonetically Balanced) が均等にカバーされているため頑健なモデル訓練を保証します。専門の言語学者により精度高くアノテーションされており、時間軸付きトランスクリプト(JSON, TextGrid, CSV 形式)が付属。句読点と文の境界も明確化されており、音声 AI のファインチューニングや本番環境でのデプロイに必要な基礎品質を備えています。 権利関係とコンプライアンス面では、商用利用および研究利用における著作権はクリア済みで、話者が使用契約書に署名済みです。GDPR および CCPA 準拠であり、個人識別情報も適切に管理されています。即時ダウンロード可能で、スタートアップ様から大企業様まで柔軟に提供可能です。音声データ収集のカスタム要件や見積もりのご希望も、お気軽にお問い合わせください。

スペイン語音声合成データセット スペイン語音声データセット ペルースペイン語音声合成データセット
2話者韓国語音声合成データセット

本製品は、音声合成、音声認識、および機械学習モデルの開発用に設計された、高品質な韓国語音声合成データです。プロな声優によって録音されて、深層学習や生成 AI の研究開発ニーズに精准にマッチします。商用利用可能な学習データとして、仮想アシスタントやナビゲーションシステムなど幅広い用途に対応しています。 技術仕様としては、サンプリングレート48kHz、24-bit、WAV 形式の高音質オーディオを提供し、音素バランスが均等にカバーされているため頑健なモデル訓練を保証します。専門の言語学者により精度高くアノテーションされており、時間軸付きトランスクリプトが付属。句読点と文の境界も明確化されており、音声AIのファインチューニングや本番環境でのデプロイに必要な品質を備えています。 権利関係とコンプライアンス面では、商用利用および研究利用における著作権はクリア済みで、話者が使用契約書に署名済みです。GDPRおよびCCPA 準拠であり、個人識別情報も適切に管理されています。即時ダウンロード可能で、スタートアップ様から大企業様まで柔軟に提供可能です。音声データ収集のカスタム要件や見積もりのご希望も、お気軽にお問い合わせください。

韓国語音声合成コーパス ネガティブ韓国語音声コーパス 韓国語音声合成向け学習音声データ 韓国語音声合成データセット
2人日本語音声合成データセット

本製品は、音声合成(TTS)、音声認識(ASR)、および機械学習モデルの開発用に設計された、高品質な日本語音声合成データセットです。日本ネイティブ話者によって録音されて、深層学習や生成 AIの研究開発ニーズに精准にマッチします。商用利用可能な学習データとして、仮想アシスタントやナビゲーションシステムなど幅広い用途に対応しています。 技術仕様としては、サンプリングレート48kHz、24bit、WAV 形式の高音質オーディオを提供し、音素バランスが均等にカバーされているため頑健なモデル訓練を保証します。専門の言語学者により精度高くアノテーションされており、時間軸付きトランスクリプト(JSON, TextGrid, CSV 形式)が付属。句読点と文の境界も明確化されており、音声 AI のファインチューニングや本番環境でのデプロイに必要な基礎品質を備えています。 権利関係とコンプライアンス面では、商用利用および研究利用における著作権はクリア済みで、話者が使用契約書に署名済みです。GDPR および CCPA 準拠であり、個人識別情報も適切に管理されています。即時ダウンロード可能で、スタートアップ様から大企業様まで柔軟に提供可能です。音声データ収集のカスタム要件や見積もりのご希望も、お気軽にお問い合わせください。

日本人日本語音声合成データセット 標準日本語音声データセット 日本語音声合成コーパス 日本語TTS音声データセット
2話者カナダ人フランス語音声合成データセット

本製品は、音声合成(TTS)、音声認識(ASR)、および機械学習モデルの開発用に設計された、高品質なフランス語音声合成データセットです。カナダ話者によって録音されて、深層学習や生成 AIの研究開発ニーズに精准にマッチします。商用利用可能な学習データとして、仮想アシスタントやナビゲーションシステムなど幅広い用途に対応しています。技術仕様としては、サンプリングレート48kHz、24bit、WAV 形式の高音質オーディオを提供し、音素バランスが均等にカバーされているため頑健なモデル訓練を保証します。専門の言語学者により精度高くアノテーションされており、時間軸付きトランスクリプト(JSON, TextGrid, CSV 形式)が付属。句読点と文の境界も明確化されており、音声AIのファインチューニングや本番環境でのデプロイに必要な基礎品質を備えています。権利関係とコンプライアンス面では、商用利用および研究利用における著作権はクリア済みで、話者が使用契約書に署名済みです。GDPR および CCPA 準拠であり、個人識別情報も適切に管理されています。即時ダウンロード可能で、スタートアップ様から大企業様まで柔軟に提供可能です。音声データ収集のカスタム要件や見積もりのご希望も、お気軽にお問い合わせください。

フランス語音声合成データセット フランス語TTSデータセット カナダフランス語音声合成データ
2話者オーストラリア英語音声合成データセット

本製品は、音声合成(TTS)、音声認識(ASR)、および機械学習モデルの開発用に設計された、高品質な2話者オーストラリア英語音声合成データセットです。合計約4時間の音声を含み、オーストラリアのネイティブ話者2名(男女各1名)によって録音されており、深層学習や生成 AI の研究開発ニーズに精准にマッチします。 商用利用可能な学習データとして、仮想アシスタント、コールセンター自動化、ナビゲーションシステム、教育コンテンツなど幅広い用途に対応しています。技術仕様としては、サンプリングレート48kHz、24-bit、WAV 形式の高音質オーディオを提供。英語音素バランスを均等にカバーし、オーストラリア英語特有の発音特徴(例:短母音のシフト、語尾上昇イントネーション)も網羅しているため、頑健なモデル訓練を保証します。 専門の言語学者により精度高くアノテーションされており、時間軸付きトランスクリプトが付属。句読点と文の境界も明確化され、音素レベル・韻律レベルの両方でラベリング済みです。音声 AI のファインチューニングや本番環境でのデプロイに必要な基礎品質を備えています。 権利関係とコンプライアンス面では、商用利用および研究利用における著作権はクリア済みで、話者全員が使用契約書に署名済みです。GDPR および CCPA 準拠であり、個人識別情報も適切に管理されています。即時ダウンロード可能で、スタートアップ様から大企業様まで柔軟に提供可能です。音声データ収集のカスタム要件や見積もりのご希望も、お気軽にお問い合わせください。

オーストラリア英語音声合成コーパス 訛り英語音声合成向けデータセット オーストラリア英語TTS向けデータセット オーストラリア英語男女音声合成向けコーパス
2話者メキシコスペイン語音声合成データセット

本製品は、音声合成(TTS)、音声認識(ASR)、および機械学習モデルの開発用に設計された、高品質なメキシコスペイン語音声合成データセットです。合計8時間の音声を含み、メキシコネイティブ話者によって録音されて、深層学習や生成 AI の研究開発ニーズに精准にマッチします。商用利用可能な学習データとして、仮想アシスタントやナビゲーションシステムなど幅広い用途に対応しています。 技術仕様としては、サンプリングレート48kHz、24-bit、WAV 形式の高音質オーディオを提供し、音素バランスが均等にカバーされているため頑健なモデル訓練を保証します。専門の言語学者により精度高くアノテーションされており、時間軸付きトランスクリプトが付属。句読点と文の境界も明確化されており、音声AIのファインチューニングや本番環境でのデプロイに必要な基礎品質を備えています。 権利関係とコンプライアンス面では、商用利用および研究利用における著作権はクリア済みで、話者が使用契約書に署名済みです。GDPR および CCPA 準拠であり、個人識別情報も適切に管理されています。即時ダウンロード可能で、スタートアップ様から大企業様まで柔軟に提供可能です。音声データ収集のカスタム要件や見積もりのご希望も、お気軽にお問い合わせください。

メキシコ人話者スペイン語音声合成コーパス メキシコスペイン語TTS音声データセット スペイン語音声合成向けコーパス メキシコスペイン語音声合成データ
ご要望をご相談ください

プロジェクトの成熟度

初期検討段階(具体的な仕様は未定)
目標は明確だが、専門的な支援が必要
開発中または最適化フェーズ
データ/アノテーションの専門チーム(明確な仕様あり)

プライバシー保護 に同意する

よくあるご質問

音声データはどのような環境で収録されていますか?

すべての音声データは、Nexdata自社のプロ仕様録音スタジオで収録されており、音声合成(TTS)専門の言語学者・音響エンジニアが監修しています。ノイズフリーな環境と高精度マイクにより、クリアで自然な音声を実現しています。

多言語や方言にも対応していますか?

はい。英語、中国語、韓国語など主要言語のネイティブスピーカーに加え、関東・関西・九州など多数の日本語方言スピーカーも保有しています。お客様のターゲットに合わせて、最適なスピーカーを迅速に選定・編成でき、プロジェクトの立ち上げを大幅にスピードアップできます。

カスタム音声データの収録・アノテーションも可能ですか?

はい、可能です。専用録音設備、経験豊富なオペレーションチーム、TTS向けに最適化されたアノテーションツールを活用し、音素ラベル・プロソディ(韻律)・感情タグなど、お客様仕様の高精度アノテーションまでワンストップで提供します。ご要望に応じて、オリジナル音声データセットの構築も承ります。

7fa19c82-56d0-41ed-a92f-8a3826f1f8f2

8b102e0d-3c8d-42dc-96d1-a6ca2559ec27