「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

48kHz・500時間高音質・話者分離日本語自然会話音声データセット

日本語音声データ
話者分離音声データ
日本語自然会話
日本語学習用データ

48kHzの高音質マイク環境で収録された、日本語2話者による500時間の2話者自然会話音声データセット。日常的なテーマに基づく対話を中心に、同時発話や重なり発話を含む実環境に近い会話音声を収録しており、話者ごとに分離された音声データと詳細なアノテーションを提供します。各発話には書き起こしテキスト、タイムスタンプ、話者ID、性別などの情報が付与されており、音声認識(ASR)、音声分離、スピーカーダイアリゼーション、音声対話AI、コールセンター分析など幅広い用途に対応可能です。日本各地域のネイティブ話者による収録により多様性を確保し、実運用環境に近い学習データとして利用できます。すべてのデータはGDPR、CCPA、PIPLに準拠して収集・管理されています。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
フォーマット
48kHz/32bit/非圧縮WAV/モノラル
内容
収録者同士の自由会話。各話者ごとに個別の音声ファイルとして収録
収録環境
比較的静かな室内環境(残響・反響なし)
収録機材
高性能コンデンサーマイク
収録国
日本
言語
日本語
アノテーション内容
書き起こしテキスト、発話タイムスタンプ、話者ID、性別情報
文字正解率
98%
サンプル サンプル
  • Audio

    [OVERLAP/]うん[/OVERLAP]うんってなるやつがすごく多い、のがあって。

  • Audio

    うん。[N]

  • Audio

    二回やるみたいな、イメージでやったら、[OVERLAP/]もう[/OVERLAP]ちょっと落ちやすいかな。

おすすめデータセットおすすめデータセット
ご要望をご相談ください

プロジェクトの成熟度

初期検討段階(具体的な仕様は未定)
目標は明確だが、専門的な支援が必要
開発中または最適化フェーズ
データ/アノテーションの専門チーム(明確な仕様あり)

プライバシー保護 に同意する

よくあるご質問

日本語の音声認識データにはどのようなバリエーションがありますか?

子どもの日常会話、モノローグ、講義、バラエティなど幅広いジャンルを含むリアルな対話音声が収録されており、話者 ID、性別、年齢、アクセントなどもアノテーションされています。

データの多様性は実際のユースケースに役立ちますか?

はい、リアルな対話と幅広い話者属性を収録しており、日本のさまざまな環境での音声認識モデルに対応可能です。

納品までのスピードはどの程度ですか?

既製データセットは最短1日で納品可能で、カスタム収集・アノテーションも迅速対応可能です。

19645d27-1cb7-4e54-9ed3-8986231921f4

1f338065-6859-4e0c-b00a-af2cc35f82a4