「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

音声認識データセット

既製の高品質なデータセットでAIモデルのパフォーマンスを
即座に向上させます。

言語

全て
188
アラビア語
2
ミャンマー語
2
中国語方言
4
英語
42
フランス語
7
ドイツ語
8
ヒンディー語
6
インドネシア語
8
イタリア語
7
日本語
7
韓国語
11
マレー語
5
中国語共通語
7
その他
37
ポルトガル語
11
ロシア語
5
スペイン語
12
タイ語
5
ベトナム語
5

データタイプ

全て
188
読み上げ
87
対話
102

日本語LR分離自然会話スマートフォン音声データセット

本データセットは、指定されたトピックに基づく自然な会話から収集された、日本語(日本)のフルデュプレックス対話音声です。テキスト内容に加え、話者ID、性別、年齢などのメタ情報を含み、AIモデルのトレーニング・評価に最適な構造となっています。収集にあたっては、日本全国の多様な地域・バックグラウンドを持つ幅広い話者層を対象とし、実世界の複雑で多様な対話シナリオにおけるモデル性能の向上を実現しています。本データセットは、複数のAI企業による品質評価を経ており、高信頼性・高再現性が実証済みです。
日本語 音声 LR分離 マルチストリーム 自然会話

743時間のイギリス英語音声データ_対話(スマートフォン)

本データは、約30の一般的なテーマに基づいてシミュレーション録音されています。このデータセットには、テキスト内容、文のタイムスタンプ、話者ID、性別など多様な属性がアノテーションされています。400名の異なる地域や文化的背景を持つネイティブなイギリス人によって録音され、高い正確性を備えており、音声認識関連の研究や応用に豊富なリソースを提供します。また、複数のAI企業による検証を経ており、モデルが現実世界の多様性に直面した際に優れたパフォーマンスを発揮するのに役立ちます。当社は、データ保護規制とプライバシー規定を厳格に遵守し、データの収集、保存、使用の過程においてユーザーのプライバシーと法的権利を保護するよう努めています。すべてのデータは、GDPR、CCPA、PIPLに準拠しています。
英語音声データ 対話音声データ イギリス音声データ

222時間の韓国英語音声データ_読み上げ(携帯電話)

韓国英語音声データ_読み上げ(携帯電話)、所定のスクリプトに基づいて読み上げて録音し、汎用、インタラクティブ、車載、ホームなどの多種多様なカテゴリをカバーし、内容が豊富です。このデータセットにはテキスト内容などさまざまな属性が表示されています、さまざまな地域と文化背景から来た500人以上の韓国人が録画に参加し、アクセントは本格的で、テキストは手作業で校正され、精度が高く、音声認識関連の研究と応用に豊富な資源を提供し、複数のAI企業のバリデーションを経て、モデルが現実世界の多様性に直面する際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護規制とプライバシー規制を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を保護することを保証し、すべてのデータはGDPR、CCPA、PIPLに従っています。
アクセント英語 韓国 英語

207時間カナダ英語音声データ_読み上げ(携帯電話)

カナダ英語音声データ_読み上げ(携帯電話)、所定のスクリプトに基づいて読み上げて録音し、汎用、インタラクティブ、車載、ホームなどの複数カテゴリーをカバーし、内容が豊富です。このデータセットにはテキスト内容などのさまざまな属性が表示されています、さまざまな地域と文化背景から来た400人以上のカナダ人が録画に参加し、アクセントは本格的で、テキストは手作業で校正され、精度が高く、音声認識関連の研究と応用に豊富な資源を提供し、複数のAI企業のバリデーションを経て、モデルが現実世界の多様性に直面する際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護規制とプライバシー規制を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を保護することを保証し、すべてのデータはGDPR、CCPA、PIPLに従っています。
カナダ 英語 アクセント英語 asr データセット

日本語・英語音声データ207時間_読み上げ(携帯電話)

日本語音声データ_読み上げ(携帯電話)は、所定のスクリプトに基づいて読み上げて録音し、汎用、インタラクティブ、車載、ホームなどの多様なカテゴリーをカバーし、内容が豊富です。このデータセットにはテキストの内容などのさまざまな属性が表示されており、さまざまな地域と文化背景から来た400人以上の日本人が録画に参加しており、アクセントは本格的で、テキストは手作業で校正されており、精度が高く、音声認識関連の研究と応用に豊富な資源を提供しており、複数のAI企業のバリデーションを経て、モデルが現実世界の多様性に直面する際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護規制とプライバシー規制を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと合法的権益を保護することを保証し、すべてのデータはGDPR、CCPA、PIPLに従っています。
アクセント英語 日本語 日本語 英語

1013時間分のブラジルポルトガル語音声データ_口語表現

本データは、ソーシャルメディア、対話、ライブ配信などの分野をカバーし、現実世界のインタラクションシナリオを反映しています。このデータセットには、テキスト内容、話者ID、性別など多様な属性がアノテーションされています。高い正確性と使いやすさを備えており、音声認識関連の研究や応用に豊富なリソースを提供します。また、複数のAI企業による検証を経ており、モデルが現実世界の多様性に直面した際に優れた性能を発揮するのに役立ちます。当社は、データ保護規制とプライバシー規定を厳格に遵守し、データの収集、保存、使用の過程においてユーザーのプライバシーと法的権利を保護するよう努めています。すべてのデータは、GDPR、CCPA、PIPLに準拠しています。
ブラジルポルトガル語 自然 スピーチ テキストアノテーション

302人のヒンディー語と英語バイリンガル音声データ_独白(スマートフォン)

ヒンディー語と英語バイリンガル音声データ_独白(スマートフォン)、指定されたトピックに基づいて独白をシミュレーション録音し、内容は汎用領域をカバー。302名の18-46歳の異なる地域や文化的背景を持つ人員によって録音され、高精度であり、音声認識関連の研究やアプリケーションに豊富なリソースを提供します。複数のAI企業による検証により、モデルが実世界の多様性に対応するのに役立つことが確認されています。データ保護法規とプライバシー規定を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと法的権利を保護します。すべてのデータはGDPR、CCPA、PIPLに準拠しています。
自然な独白 自然な音声 ヒンディー語 英語 バイリンガル

98時間インドネシア語子供音声データ_口語化

インドネシア語児童音声データ_口語版は、内容がセルフメディア、対話、ライブ配信、講義、バラエティ等の汎用分野を網羅し、実世界のインタラクションシーンを反映する。本データセットはテキスト内容、話者識別、性別、アクセント等多様な属性でアノテーションを実施した。12歳以下の異なる地域・文化的背景を持つインドネシアの児童により録音され、高精度で扱いやすく、音声認識関連の研究・応用に豊富なリソースを提供。モデルの実世界多様性対応を支援。データ保護法規とプライバシー規定を厳格に順守し、データ収集、保存、利用の全過程でユーザーのプライバシーと法的権利を保護する。全データはGDPR、CCPA、PIPLに準拠する。
インドネシア語 文字起こし 音声データ

100時間タイ語子供音声データ_口語化

タイタイ語児童音声データ_口語版は、内容がセルフメディア、対話、ライブ配信、講義、バラエティ等の汎用分野を網羅し、実世界のインタラクションシーンを反映する。本データセットはテキスト内容、話者識別、性別、アクセント等多様な属性でアノテーションを実施した。12歳以下の異なる地域・文化的背景を持つタイの児童により録音され、高精度で扱いやすく、音声認識関連の研究・応用に豊富なリソースを提供。モデルの実世界多様性対応を支援できる。データ保護法規とプライバシー規定を厳格に順守し、データ収集、保存、利用の全過程でユーザーのプライバシーと法的権利を保護する。全データはGDPR、CCPA、PIPLに準拠する。
自然発話 タイ語 音声データ 文字起こし
. . .

loading

今すぐデータをカスタマイズ

既製データセットの強み

  • 著作権あり

    著作権あり

    自社版権で すぐ納品可能
  • 安全

    安全

    承認済み 安全で使用可能
  • 専門性高い

    専門性高い

    AIデータの専門家により 設計・作成
  • 多様性に富む

    多様性に富む

    様々な 実際のシーンから収集
  • コスパ高い

    コスパ高い

    カスタマイズより コスパが優れている
  • 効率的

    効率的

    即座に 納品可能
bf0b5698-abdd-40f5-8b41-3a9f43abfbd8