「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

日本語LR分離自然会話スマートフォン音声データセット

日本語
音声
LR分離
マルチストリーム
自然会話

本データセットは、指定されたトピックに基づく自然な会話から収集された、日本語(日本)のフルデュプレックス対話音声です。テキスト内容に加え、話者ID、性別、年齢などのメタ情報を含み、AIモデルのトレーニング・評価に最適な構造となっています。収集にあたっては、日本全国の多様な地域・バックグラウンドを持つ幅広い話者層を対象とし、実世界の複雑で多様な対話シナリオにおけるモデル性能の向上を実現しています。本データセットは、複数のAI企業による品質評価を経ており、高信頼性・高再現性が実証済みです。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
フォーマット
24kHz, 16 bit, wav, モノラルチャンネル
音声コンテンツ
与えられたトピックに基づく自由対話
収集環境
室内静かな環境
収集設備
Android スマホ, iPhone
話者
200人
日本
言語
日本語
アノテーション特徴
会話内容、話者ID、性別、年齢などの属性を転写
正確率
文単位正確率(SAR)95%
サンプル サンプル
  • Audio

    徳川綱吉で、ですかね、覚えて[OVERLAP/]いま[/OVERLAP]すか。

  • Audio

    なんかすいません、切れちゃってごめんなさい。

  • Audio

    旅行、行った時とかに見たりするんですか?[N]

  • Audio

    え、なんか印象に残ってるとか良かったお城あったりしますか。

おすすめデータセットおすすめデータセット
ご要望をご相談ください

プライバシー保護 に同意する

よくあるご質問

日本語の音声認識データにはどのようなバリエーションがありますか?

子どもの日常会話、モノローグ、講義、バラエティなど幅広いジャンルを含むリアルな対話音声が収録されており、話者 ID、性別、年齢、アクセントなどもアノテーションされています。

データの多様性は実際のユースケースに役立ちますか?

はい、リアルな対話と幅広い話者属性を収録しており、日本のさまざまな環境での音声認識モデルに対応可能です。

納品までのスピードはどの程度ですか?

既製データセットは最短1日で納品可能で、カスタム収集・アノテーションも迅速対応可能です。

ecaba709-1864-4840-ba6c-b9360b5f07af

ab5bcc51-41c1-40a9-bd7f-f2f75d6fb3b1