「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

音声認識データセット

既製の高品質なデータセットでAIモデルのパフォーマンスを
即座に向上させます。

言語

全て
188
アラビア語
2
ミャンマー語
2
中国語方言
4
英語
42
フランス語
7
ドイツ語
8
ヒンディー語
6
インドネシア語
8
イタリア語
7
日本語
7
韓国語
11
マレー語
5
中国語共通語
7
その他
37
ポルトガル語
11
ロシア語
5
スペイン語
12
タイ語
5
ベトナム語
5

データタイプ

全て
188
読み上げ
87
対話
102

日本語LR分離自然会話スマートフォン音声データセット

本データセットは、指定されたトピックに基づく自然な会話から収集された、日本語(日本)のフルデュプレックス対話音声です。テキスト内容に加え、話者ID、性別、年齢などのメタ情報を含み、AIモデルのトレーニング・評価に最適な構造となっています。収集にあたっては、日本全国の多様な地域・バックグラウンドを持つ幅広い話者層を対象とし、実世界の複雑で多様な対話シナリオにおけるモデル性能の向上を実現しています。本データセットは、複数のAI企業による品質評価を経ており、高信頼性・高再現性が実証済みです。
日本語 音声 LR分離 マルチストリーム 自然会話

743時間のイギリス英語音声データ_対話(スマートフォン)

本データは、約30の一般的なテーマに基づいてシミュレーション録音されています。このデータセットには、テキスト内容、文のタイムスタンプ、話者ID、性別など多様な属性がアノテーションされています。400名の異なる地域や文化的背景を持つネイティブなイギリス人によって録音され、高い正確性を備えており、音声認識関連の研究や応用に豊富なリソースを提供します。また、複数のAI企業による検証を経ており、モデルが現実世界の多様性に直面した際に優れたパフォーマンスを発揮するのに役立ちます。当社は、データ保護規制とプライバシー規定を厳格に遵守し、データの収集、保存、使用の過程においてユーザーのプライバシーと法的権利を保護するよう努めています。すべてのデータは、GDPR、CCPA、PIPLに準拠しています。
英語音声データ 対話音声データ イギリス音声データ

222時間の韓国英語音声データ_読み上げ(携帯電話)

韓国英語音声データ_読み上げ(携帯電話)、所定のスクリプトに基づいて読み上げて録音し、汎用、インタラクティブ、車載、ホームなどの多種多様なカテゴリをカバーし、内容が豊富です。このデータセットにはテキスト内容などさまざまな属性が表示されています、さまざまな地域と文化背景から来た500人以上の韓国人が録画に参加し、アクセントは本格的で、テキストは手作業で校正され、精度が高く、音声認識関連の研究と応用に豊富な資源を提供し、複数のAI企業のバリデーションを経て、モデルが現実世界の多様性に直面する際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護規制とプライバシー規制を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を保護することを保証し、すべてのデータはGDPR、CCPA、PIPLに従っています。
アクセント英語 韓国 英語

207時間カナダ英語音声データ_読み上げ(携帯電話)

カナダ英語音声データ_読み上げ(携帯電話)、所定のスクリプトに基づいて読み上げて録音し、汎用、インタラクティブ、車載、ホームなどの複数カテゴリーをカバーし、内容が豊富です。このデータセットにはテキスト内容などのさまざまな属性が表示されています、さまざまな地域と文化背景から来た400人以上のカナダ人が録画に参加し、アクセントは本格的で、テキストは手作業で校正され、精度が高く、音声認識関連の研究と応用に豊富な資源を提供し、複数のAI企業のバリデーションを経て、モデルが現実世界の多様性に直面する際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護規制とプライバシー規制を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を保護することを保証し、すべてのデータはGDPR、CCPA、PIPLに従っています。
カナダ 英語 アクセント英語 asr データセット

日本語・英語音声データ207時間_読み上げ(携帯電話)

日本語音声データ_読み上げ(携帯電話)は、所定のスクリプトに基づいて読み上げて録音し、汎用、インタラクティブ、車載、ホームなどの多様なカテゴリーをカバーし、内容が豊富です。このデータセットにはテキストの内容などのさまざまな属性が表示されており、さまざまな地域と文化背景から来た400人以上の日本人が録画に参加しており、アクセントは本格的で、テキストは手作業で校正されており、精度が高く、音声認識関連の研究と応用に豊富な資源を提供しており、複数のAI企業のバリデーションを経て、モデルが現実世界の多様性に直面する際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護規制とプライバシー規制を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を保護することを保証し、すべてのデータはGDPR、CCPA、PIPLに従っています。
アクセント英語 日本語 日本語 英語

522時間分のフィリピン語音声データ(朗読・スマートフォン収録)

フィリピン語音声データ_朗読(スマートフォン)、事前に提供されたスクリプトに基づいて朗読し、模擬録音された。 内容は汎用口語類、ニュース類をカバー。 本データセットにはテキスト内容がアノテーションされている。 2,675名 フィリピン現地人によって録音され、正確性が高い。大半のAI企業によって検証済みであり、モデルが現実世界の多様性に徐々に優れた性能を発揮することに有用である。私たちはデータ保護法およびプライバシー規定を遵守し、データの収集・保存・利用の段階でユーザーのプライバシーと合法的な権利を確実に守っている。
フィリピン語音声データ 携帯電話音声データ タガログ語音声データ タガログ語音声データセット

797時間ヒンディー語音声データ_会話(携帯電話)

ヒンディー語音声データ_会話(携帯電話)は、約30の一般的なテーマに基づいてアナログ録音される。このデータセットはテキストの内容、文のタイムスタンプ、話し手の身分、性別などの多種の属性をマークし、異なる地域と文化的背景から来た1022人のインド本土人によって録音され、正確性が高く、音声認識関連の研究と応用に豊富な資源を提供し、複数のAI会社によって検証された:モデルが実際の世界の多様性に直面する際に優れた表現をするのに役立つ。私たちはデータ保護法規とプライバシー規定に厳格に従い、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を維持することを確保し、すべてのデータはGDPR、CCPA、 PIPLに準拠しています。
ヒンディー語 会話音声 ヒンディー語討論データ ヒンディー語討論集 ヒンディー語討論収集 ヒンディー語雑談データ ヒンディー語雑談集 ヒンディー語会話収集 ヒンディー語雑談データ ヒンディー語雑談集 ヒンディー語雑談収集 ヒンディー語通信データセット ヒンディー語通信収集 ヒンディー語音声データ ヒンディー語音声集 ヒンディー語音声収集 ヒンディー語対話データ ヒンディー語対話集 ヒンディー語討論データ ヒンディー雑談データ ヒンディー雑談データセット

501時間インド英語音声データ_口語化

インドの英語音声データ_口語化、内容はインタビュー、バラエティ、生放送などの分野をカバーしている。実世界の相互作用の状況を反映している。このデータセットはテキストの内容、話し手の身分性別などの多種の属性をマークし、異なる地域と文化的背景からのインド本土人によって録音され、正確性が高く、使い易さが強く、音声認識関連の研究と応用に豊富な資源を提供し、モデルが真の世界の多様性に直面する際に優れた表現をするのに役立つ。私たちはデータ保護法規とプライバシー規定に厳格に従い、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を維持することを確保し、すべてのデータはGDPR、CCPA、PIPLに準拠しています。
口語ビデオ テキストアノテーション インド英語会話ビデオ インド英語会話ビデオデータ インド英語会話データ インド英語会話データセット インド英語会話 インド英語日常会話ビデオ インド英語日常会話データ インド英語日常会話データセット

338時間ロシア語自然会話音声データセット

本データセットは、話者が約30の日常的なテーマから得意なものを選び、スマートフォンで自然な会話を録音した高品質なロシア語音声です。460人の話者は、地域や文化的背景が多様で、各音声には発話内容、タイミング、性別などの話者属性が正確にアノテーションされており、音声認識の研究や実用的なアプリケーション開発に最適です。複数のAI企業による評価でも、実世界の言語的多様性への対応において高い有効性が実証されています。全データは話者の明示的な同意を得て収集されており、機械学習の研究・開発および商用利用が可能です。
自然会話 音声認識 ロシア語音声コーパス ロシア語自然会話
. . .

loading

今すぐデータをカスタマイズ

既製データセットの強み

  • 著作権あり

    著作権あり

    自社版権で すぐ納品可能
  • 安全

    安全

    承認済み 安全で使用可能
  • 専門性高い

    専門性高い

    AIデータの専門家により 設計・作成
  • 多様性に富む

    多様性に富む

    様々な 実際のシーンから収集
  • コスパ高い

    コスパ高い

    カスタマイズより コスパが優れている
  • 効率的

    効率的

    即座に 納品可能
38c7a171-667d-4387-baae-d5b394c2faa4