「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

531時間分の走行シーン(車内)におけるノイズデータ(携帯電話+マイク)

マイク付きハンドセットによる車両ノイズデータの収集
車両ノイズデータの収集
車両のノイズ
車両ノイズデータ

走行シーン(車内)におけるノイズデータ(携帯電話+マイク)。このデータには、さまざまな車種、道路の種類、車両速度、および窓の開閉状態が含まれています。また、車内の異なる位置に6つの録音ポイントを配置し、各位置でのノイズ状況を正確に記録することで、車両ノイズモデリングの要件に正確に適合しています。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
フォーマット
マイク:32kHz、32bit、wav形式、モノラル 携帯電話:16kHz、16bit、wav形式、モノラル
データの特徴
5種類の条件を含み、各条件には複数のシナリオが存在;各音声ファイルは、特定のシナリオの組み合わせに対応
収集時の天候
晴天:317時間 雨天:214時間
録音環境
車載シーン(異なる価格帯・車種の計10台の車両を対象)
設備
4台のマイクと2台の携帯電話で同時録音、機材は車内の6箇所に設置
アノテーションの特徴
道路タイプ、天候、エアコンのオンオフなどの情報が含まれています
適用シーン
ノイズモデリング
サンプル サンプル
  • Audio

    道路类型:停车怠速(0);天气:晴天;空调开关:关;右前车窗:关闭;右后车窗:关闭;气温:2;拥堵情况:畅通;平均车速:0;车型:轿车别克君威

  • Audio

    道路类型:停车怠速(0);天气:晴天;空调开关:中;右前车窗:关闭;右后车窗:关闭;气温:1;拥堵情况:正常;平均车速:0;车型:轿车大众捷达

  • Audio

    道路类型:环线辅路(65,±15);天气:雨天;空调开关:高;右前车窗:关闭;右后车窗:关闭;气温:24;拥堵情况:疏通;平均车速:71;车型:别克昂拉克

  • Audio

    道路类型:环线辅路(65,±15);天气:晴天;空调开关:关;右前车窗:关闭;右后车窗:关闭;气温:3;拥堵情况:正常;平均车速:65;车型:东风日产奇骏

  • Audio

    道路类型:环线辅路(65,±15);天气:晴天;空调开关:关;右前车窗:关闭;右后车窗:打开2cm;气温:6;拥堵情况:无拥堵;平均车速:68;车型:丰田雷凌

おすすめデータセットおすすめデータセット
48kHz・579時間高音質・話者分離日本語自然会話音声データセット

本データは、フルデュプレックス(全二重)対話を前提に収録した高品質な日本語音声データセットです。半二重方式では再現が難しい同時発話や重なり発話、自然な相槌や割込みを含み、双方向に同時進行する対話を再現した同時双方向音声データセットとして、リアルタイム対話AIや次世代ASRの研究開発に適しています。本セットは、提示されたトピックリストから収録者が複数の得意分野を選択し、自然な流れで会話を展開して収録した日本語自然会話音声データセットです。日本各地のネイティブ話者による多様な対話を含み、高音質収録によりASRの音響・言語モデル学習、声紋識別、対話システム評価など幅広い研究用途に活用できます。データは各種プライバシー保護規制に準拠して管理されています。当社の全二重音声データセットシリーズは、日本語をはじめ、英語、韓国語など多言語に対応し、書き起こしテキスト、発話タイムスタンプ、話者ID、性別などの詳細アノテーションを標準搭載しています。また、話者ごとの独立音声を含む話者分離音声データセットとしても利用可能で、収録条件や話者属性、ラベル仕様のカスタマイズ収集・作成にも柔軟に対応します。

日本語音声データ 話者分離音声データ 全二重音声データセット 同時双方向音声データセット 日本語自然会話音声データ
10時間ペルースペイン語音声合成データセット

本製品は、音声合成(TTS)、音声認識(ASR)、および機械学習モデルの開発用に設計された、高品質なペルースペイン語音声合成データセットです。合計10時間の音声を含み、ペルーのネイティブ話者によって録音されて、深層学習や生成 AI の研究開発ニーズに精准にマッチします。商用利用可能な学習データとして、仮想アシスタントやナビゲーションシステムなど幅広い用途に対応しています。 技術仕様としては、サンプリングレート48kHz、24-bit、WAV 形式の高音質オーディオを提供し、音素バランス(Phonetically Balanced) が均等にカバーされているため頑健なモデル訓練を保証します。専門の言語学者により精度高くアノテーションされており、時間軸付きトランスクリプト(JSON, TextGrid, CSV 形式)が付属。句読点と文の境界も明確化されており、音声 AI のファインチューニングや本番環境でのデプロイに必要な基礎品質を備えています。 権利関係とコンプライアンス面では、商用利用および研究利用における著作権はクリア済みで、話者が使用契約書に署名済みです。GDPR および CCPA 準拠であり、個人識別情報も適切に管理されています。即時ダウンロード可能で、スタートアップ様から大企業様まで柔軟に提供可能です。音声データ収集のカスタム要件や見積もりのご希望も、お気軽にお問い合わせください。

スペイン語音声合成データセット スペイン語音声データセット ペルースペイン語音声合成データセット
300時間タガログ語スマートフォン収録音読音声データ

タガログ語音声データ_音読(スマートフォン)は、指定されたスクリプトに基づいて音読、録音をシミュレートしたもの。内容は会話·評論、インタラクティブ系、車載、ホームデバイスコマンド系と文字列等様々な分野を網羅し、豊富なコンテンツを有しました。本データセットはテキスト内容等、複数の属性をラベリングし、高い正確度を誇りながら、音声認識に関する研究とその応用に豊富なリソースを提供しています。複数のAI企業が検証したところ、本データセット現実世界の網羅性とバリデーションに面するモデルのパフォーマンス向上に貢献。当社はデータ保護法規およびプライバシー規則を厳守し、データセットや保存とその活用のプロセスでユーザーのプライバシーと合法的権益の保護に尽力します。全データはGDPR、CCPA、PIPLに準拠しています。 タガログ語音声データ_音読(スマートフォン)は、指定されたスクリプトに基づいて音読、録音をシミュレートしたもの。内容は会話·評論、インタラクティブ系、車載、ホームデバイスコマンド系と文字列等様々な分野を網羅し、豊富なコンテンツを有しました。本データセットはテキスト内容等、複数の属性をラベリングし、高い正確度を誇りながら、音声認識に関する研究とその応用に豊富なリソースを提供しています。複数のAI企業が検証したところ、本データセット現実世界の網羅性とバリデーションに面するモデルのパフォーマンス向上に貢献。当社はデータ保護法規およびプライバシー規則を厳守し、データセットや保存とその活用のプロセスでユーザーのプライバシーと合法的権益の保護に尽力します。全データはGDPR、CCPA、PIPLに準拠しています。

タガログ語 フィリピン スマートフォン 音読 台本付きモノローグ
ご要望をご相談ください

プロジェクトの成熟度

初期検討段階(具体的な仕様は未定)
目標は明確だが、専門的な支援が必要
開発中または最適化フェーズ
データ/アノテーションの専門チーム(明確な仕様あり)

プライバシー保護 に同意する

よくあるご質問

日本語の音声認識データにはどのようなバリエーションがありますか?

子どもの日常会話、モノローグ、講義、バラエティなど幅広いジャンルを含むリアルな対話音声が収録されており、話者 ID、性別、年齢、アクセントなどもアノテーションされています。

データの多様性は実際のユースケースに役立ちますか?

はい、リアルな対話と幅広い話者属性を収録しており、日本のさまざまな環境での音声認識モデルに対応可能です。

納品までのスピードはどの程度ですか?

既製データセットは最短1日で納品可能で、カスタム収集・アノテーションも迅速対応可能です。

bc49afd3-cbfc-4e7a-89c2-8516c417831d

a5d39d7b-978b-4703-9e28-a59301f88717