「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

音声認識データセット

既製の高品質なデータセットでAIモデルのパフォーマンスを
即座に向上させます。

言語

全て
187
アラビア語
2
ミャンマー語
2
中国語方言
4
英語
42
フランス語
7
ドイツ語
8
ヒンディー語
6
インドネシア語
8
イタリア語
7
日本語
7
韓国語
11
マレー語
5
中国語共通語
6
その他
37
ポルトガル語
11
ロシア語
5
スペイン語
12
タイ語
5
ベトナム語
5

データタイプ

全て
187
読み上げ
87
対話
101

日本語LR分離自然会話スマートフォン音声データセット

本データセットは、指定されたトピックに基づく自然な会話から収集された、日本語(日本)のフルデュプレックス対話音声です。テキスト内容に加え、話者ID、性別、年齢などのメタ情報を含み、AIモデルのトレーニング・評価に最適な構造となっています。収集にあたっては、日本全国の多様な地域・バックグラウンドを持つ幅広い話者層を対象とし、実世界の複雑で多様な対話シナリオにおけるモデル性能の向上を実現しています。本データセットは、複数のAI企業による品質評価を経ており、高信頼性・高再現性が実証済みです。
日本語 音声 LR分離 マルチストリーム 自然会話

743時間のイギリス英語音声データ_対話(スマートフォン)

本データは、約30の一般的なテーマに基づいてシミュレーション録音されています。このデータセットには、テキスト内容、文のタイムスタンプ、話者ID、性別など多様な属性がアノテーションされています。400名の異なる地域や文化的背景を持つネイティブなイギリス人によって録音され、高い正確性を備えており、音声認識関連の研究や応用に豊富なリソースを提供します。また、複数のAI企業による検証を経ており、モデルが現実世界の多様性に直面した際に優れたパフォーマンスを発揮するのに役立ちます。当社は、データ保護規制とプライバシー規定を厳格に遵守し、データの収集、保存、使用の過程においてユーザーのプライバシーと法的権利を保護するよう努めています。すべてのデータは、GDPR、CCPA、PIPLに準拠しています。
英語音声データ 対話音声データ イギリス音声データ

222時間の韓国英語音声データ_読み上げ(携帯電話)

韓国英語音声データ_読み上げ(携帯電話)、所定のスクリプトに基づいて読み上げて録音し、汎用、インタラクティブ、車載、ホームなどの多種多様なカテゴリをカバーし、内容が豊富です。このデータセットにはテキスト内容などさまざまな属性が表示されています、さまざまな地域と文化背景から来た500人以上の韓国人が録画に参加し、アクセントは本格的で、テキストは手作業で校正され、精度が高く、音声認識関連の研究と応用に豊富な資源を提供し、複数のAI企業のバリデーションを経て、モデルが現実世界の多様性に直面する際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護規制とプライバシー規制を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を保護することを保証し、すべてのデータはGDPR、CCPA、PIPLに従っています。
アクセント英語 韓国 英語

207時間カナダ英語音声データ_読み上げ(携帯電話)

カナダ英語音声データ_読み上げ(携帯電話)、所定のスクリプトに基づいて読み上げて録音し、汎用、インタラクティブ、車載、ホームなどの複数カテゴリーをカバーし、内容が豊富です。このデータセットにはテキスト内容などのさまざまな属性が表示されています、さまざまな地域と文化背景から来た400人以上のカナダ人が録画に参加し、アクセントは本格的で、テキストは手作業で校正され、精度が高く、音声認識関連の研究と応用に豊富な資源を提供し、複数のAI企業のバリデーションを経て、モデルが現実世界の多様性に直面する際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護規制とプライバシー規制を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を保護することを保証し、すべてのデータはGDPR、CCPA、PIPLに従っています。
カナダ 英語 アクセント英語 asr データセット

日本語・英語音声データ207時間_読み上げ(携帯電話)

日本語音声データ_読み上げ(携帯電話)は、所定のスクリプトに基づいて読み上げて録音し、汎用、インタラクティブ、車載、ホームなどの多様なカテゴリーをカバーし、内容が豊富です。このデータセットにはテキストの内容などのさまざまな属性が表示されており、さまざまな地域と文化背景から来た400人以上の日本人が録画に参加しており、アクセントは本格的で、テキストは手作業で校正されており、精度が高く、音声認識関連の研究と応用に豊富な資源を提供しており、複数のAI企業のバリデーションを経て、モデルが現実世界の多様性に直面する際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護規制とプライバシー規制を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を保護することを保証し、すべてのデータはGDPR、CCPA、PIPLに従っています。
アクセント英語 日本語 日本語 英語

グジャラート語の脚本に基づいた会話音声データ

グジャラート語の脚本に基づいた会話音声データは、与えられた脚本に基づいて会話をシミュレーションし、録音したもので、複数の分野をカバーし、内容が豊富である。このデータセットには、テキスト内容などの多様な属性がラベリングされており、高い正確性を備えており、音声認識に関する研究や応用に豊富なリソースを提供している。複数のAI企業による検証結果、このデータはモデルが現実世界の多様性に直面した際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護法規やプライバシーに関する規定を厳格に遵守し、データの収集、保存、利用の過程でユーザーのプライバシーと合法的な権益を守り、すべてのデータはGDPR、CCPA、PIPLに準拠している。
グジャラート語 インド 会話音声

215時間韓国語金融業界音声データセット

韓国語の金融音声データは、多様な話者による自然な口語対話で、実際の金融シーンをリアルに再現しています。内容はマクロ金融(経済動向、金融政策、為替など)からミクロ金融(個別企業、株式・債券、資産運用など)まで幅広く、専門用語も日常会話の中で自然に使われています。話者ID、性別、金融エンティティ(通貨、商品名、機関名など)は正確にアノテーションされており、音声認識や情報抽出のAI開発にそのまま活用可能です。複数のAI企業がモデル訓練にこのデータを用い、多様な金融対話への対応力が向上したと報告しています。全音声は話者が利用目的を理解した上で提供しており、研究・開発および商用利用が認められています。
韓国語音声コーパス 韓国語音声会話 金融業界 音声認識

96時間日本日本語子供音声データセット

日本語子供音声データ(12歳以下)は、日常会話、学校でのやり取り、ゲーム実況、動画配信、学習・講義、バラエティ風トークなど、子どもたちが実際に使う多様な口語シーンを収録しています。全国の異なる地域・文化的背景を持つ子どもたちが参加し、テキスト、話者ID、性別、アクセントなどの属性を正確にアノテーション。音声認識や対話システムの開発に活用可能な高品質データです。複数のAI開発チームが実証済みで、モデルが実際の子ども言葉に対応する上で効果を発揮しています。全データは保護者の同意を得て収集されており、研究・開発および商用利用が可能です。
日本語音声データ 子供音声コーパス 日本語音声認識 日本語音声会話

203時間ドイツ語金融業界音声データセット

203時間におよぶドイツ語の金融ドメイン音声データは、マクロ経済やミクロ金融に関わる実際の会話シーンを再現したもので、金融専門用語を高密度に含んだ自然な口語表現が特徴です。テキスト内容に加え、話者ID、性別、および金融関連エンティティ(企業名、通貨、商品名など)を正確にアノテーションしており、音声認識をはじめとするさまざまなAIアプリケーションに活用可能な高品質リソースです。複数のAI企業がこのデータを実際にモデル訓練に活用し、金融現場の多様なやり取りに良好な対応力を示しています。音声はすべて話者が用途を理解した上で提供しており、機械学習の研究・開発、および製品への組み込みを含む商用利用が認められています。
ドイツ語 金融業界 ドイツ語音声コーパス ドイツ語音声認識
. . .

loading

今すぐデータをカスタマイズ

既製データセットの強み

  • 著作権あり

    著作権あり

    自社版権で すぐ納品可能
  • 安全

    安全

    承認済み 安全で使用可能
  • 専門性高い

    専門性高い

    AIデータの専門家により 設計・作成
  • 多様性に富む

    多様性に富む

    様々な 実際のシーンから収集
  • コスパ高い

    コスパ高い

    カスタマイズより コスパが優れている
  • 効率的

    効率的

    即座に 納品可能
68967508-f9a1-4581-a3a9-1ae0e832a30d