「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

音声認識データセット

既製の高品質なデータセットでAIモデルのパフォーマンスを
即座に向上させます。

言語

全て
188
アラビア語
2
ミャンマー語
2
中国語方言
4
英語
42
フランス語
7
ドイツ語
8
ヒンディー語
6
インドネシア語
8
イタリア語
7
日本語
7
韓国語
11
マレー語
5
中国語共通語
7
その他
37
ポルトガル語
11
ロシア語
5
スペイン語
12
タイ語
5
ベトナム語
5

データタイプ

全て
188
読み上げ
87
対話
102

日本語LR分離自然会話スマートフォン音声データセット

本データセットは、指定されたトピックに基づく自然な会話から収集された、日本語(日本)のフルデュプレックス対話音声です。テキスト内容に加え、話者ID、性別、年齢などのメタ情報を含み、AIモデルのトレーニング・評価に最適な構造となっています。収集にあたっては、日本全国の多様な地域・バックグラウンドを持つ幅広い話者層を対象とし、実世界の複雑で多様な対話シナリオにおけるモデル性能の向上を実現しています。本データセットは、複数のAI企業による品質評価を経ており、高信頼性・高再現性が実証済みです。
日本語 音声 LR分離 マルチストリーム 自然会話

743時間のイギリス英語音声データ_対話(スマートフォン)

本データは、約30の一般的なテーマに基づいてシミュレーション録音されています。このデータセットには、テキスト内容、文のタイムスタンプ、話者ID、性別など多様な属性がアノテーションされています。400名の異なる地域や文化的背景を持つネイティブなイギリス人によって録音され、高い正確性を備えており、音声認識関連の研究や応用に豊富なリソースを提供します。また、複数のAI企業による検証を経ており、モデルが現実世界の多様性に直面した際に優れたパフォーマンスを発揮するのに役立ちます。当社は、データ保護規制とプライバシー規定を厳格に遵守し、データの収集、保存、使用の過程においてユーザーのプライバシーと法的権利を保護するよう努めています。すべてのデータは、GDPR、CCPA、PIPLに準拠しています。
英語音声データ 対話音声データ イギリス音声データ

222時間の韓国英語音声データ_読み上げ(携帯電話)

韓国英語音声データ_読み上げ(携帯電話)、所定のスクリプトに基づいて読み上げて録音し、汎用、インタラクティブ、車載、ホームなどの多種多様なカテゴリをカバーし、内容が豊富です。このデータセットにはテキスト内容などさまざまな属性が表示されています、さまざまな地域と文化背景から来た500人以上の韓国人が録画に参加し、アクセントは本格的で、テキストは手作業で校正され、精度が高く、音声認識関連の研究と応用に豊富な資源を提供し、複数のAI企業のバリデーションを経て、モデルが現実世界の多様性に直面する際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護規制とプライバシー規制を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を保護することを保証し、すべてのデータはGDPR、CCPA、PIPLに従っています。
アクセント英語 韓国 英語

207時間カナダ英語音声データ_読み上げ(携帯電話)

カナダ英語音声データ_読み上げ(携帯電話)、所定のスクリプトに基づいて読み上げて録音し、汎用、インタラクティブ、車載、ホームなどの複数カテゴリーをカバーし、内容が豊富です。このデータセットにはテキスト内容などのさまざまな属性が表示されています、さまざまな地域と文化背景から来た400人以上のカナダ人が録画に参加し、アクセントは本格的で、テキストは手作業で校正され、精度が高く、音声認識関連の研究と応用に豊富な資源を提供し、複数のAI企業のバリデーションを経て、モデルが現実世界の多様性に直面する際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護規制とプライバシー規制を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を保護することを保証し、すべてのデータはGDPR、CCPA、PIPLに従っています。
カナダ 英語 アクセント英語 asr データセット

日本語・英語音声データ207時間_読み上げ(携帯電話)

日本語音声データ_読み上げ(携帯電話)は、所定のスクリプトに基づいて読み上げて録音し、汎用、インタラクティブ、車載、ホームなどの多様なカテゴリーをカバーし、内容が豊富です。このデータセットにはテキストの内容などのさまざまな属性が表示されており、さまざまな地域と文化背景から来た400人以上の日本人が録画に参加しており、アクセントは本格的で、テキストは手作業で校正されており、精度が高く、音声認識関連の研究と応用に豊富な資源を提供しており、複数のAI企業のバリデーションを経て、モデルが現実世界の多様性に直面する際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護規制とプライバシー規制を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を保護することを保証し、すべてのデータはGDPR、CCPA、PIPLに従っています。
アクセント英語 日本語 日本語 英語

522時間分のフィリピン語音声データ(朗読・スマートフォン収録)

フィリピン語音声データ_朗読(スマートフォン)、事前に提供されたスクリプトに基づいて朗読し、模擬録音された。 内容は汎用口語類、ニュース類をカバー。 本データセットにはテキスト内容がアノテーションされている。 2,675名 フィリピン現地人によって録音され、正確性が高い。大半のAI企業によって検証済みであり、モデルが現実世界の多様性に徐々に優れた性能を発揮することに有用である。私たちはデータ保護法およびプライバシー規定を遵守し、データの収集・保存・利用の段階でユーザーのプライバシーと合法的な権利を確実に守っている。
フィリピン語音声データ 携帯電話音声データ タガログ語音声データ タガログ語音声データセット

162時間分のフランス語児童音声データ_口語形式

フランス語児童音声データ_口語形式は、ソーシャルメディア系、対話、ライブ配信、講義、バラエティなどの一般的な分野をカバーし、現実世界のインタラクションシナリオを反映しています。このデータセットには、テキスト内容、話者ID、性別、アクセントなど多様な属性がアノテーショされています。12歳以下の異なる地域や文化的背景を持つフランス児童によって録音され、高い正確性と使いやすさを備えており、音声認識関連の研究や応用に豊富なリソースを提供します。モデルが現実世界の多様性に直面した際に優れた性能を発揮するのに役立ちます。当社は、データ保護規制とプライバシー規定を厳格に遵守し、データの収集、保存、使用の過程においてユーザーのプライバシーと法的権利を保護するよう努めています。すべてのデータは、GDPR、CCPA、PIPLに準拠しています。
フランス語 自然 スピーチ 子供

144.6時間のスペイン・スペイン語児童音声データ_口語形式

スペイン・スペイン語児童音声データ_口語形式は、ソーシャルメディア系、対話、ライブ配信、講義、バラエティなどの一般的な分野をカバーし、現実世界のインタラクションシナリオを反映しています。このデータセットには、テキスト内容、話者ID、性別、アクセントなど多様な属性がアノテーショされています。12歳以下の異なる地域や文化的背景を持つスペイン児童によって録音され、高い正確性と使いやすさを備えており、音声認識関連の研究や応用に豊富なリソースを提供します。モデルが現実世界の多様性に直面した際に優れた性能を発揮するのに役立ちます。当社は、データ保護規制とプライバシー規定を厳格に遵守し、データの収集、保存、使用の過程においてユーザーのプライバシーと法的権利を保護するよう努めています。すべてのデータは、GDPR、CCPA、PIPLに準拠しています。
スペイン語 自然 スピーチ テキストアノテーション

1013時間分のブラジルポルトガル語音声データ_口語表現

本データは、ソーシャルメディア、対話、ライブ配信などの分野をカバーし、現実世界のインタラクションシナリオを反映しています。このデータセットには、テキスト内容、話者ID、性別など多様な属性がアノテーションされています。高い正確性と使いやすさを備えており、音声認識関連の研究や応用に豊富なリソースを提供します。また、複数のAI企業による検証を経ており、モデルが現実世界の多様性に直面した際に優れた性能を発揮するのに役立ちます。当社は、データ保護規制とプライバシー規定を厳格に遵守し、データの収集、保存、使用の過程においてユーザーのプライバシーと法的権利を保護するよう努めています。すべてのデータは、GDPR、CCPA、PIPLに準拠しています。
ブラジルポルトガル語 自然 スピーチ テキストアノテーション
. . .

loading

今すぐデータをカスタマイズ

既製データセットの強み

  • 著作権あり

    著作権あり

    自社版権で すぐ納品可能
  • 安全

    安全

    承認済み 安全で使用可能
  • 専門性高い

    専門性高い

    AIデータの専門家により 設計・作成
  • 多様性に富む

    多様性に富む

    様々な 実際のシーンから収集
  • コスパ高い

    コスパ高い

    カスタマイズより コスパが優れている
  • 効率的

    効率的

    即座に 納品可能
a9fea451-4a70-4ec9-a437-daaf85dd987f