491人の命令語音声データ_音読（Bluetoothイヤホン）

命令語

音声アシスタント

車載音声データ

命令語音声データセット

命令語のBluetoothイヤホンによる音声データ収集は、491名の中国本土の話者から行われ、各話者は同じ内容のコーパスを録音します。コーパスの内容は17件の一般的な命令語です。話者の男女比は均等で、複数の年齢層をカバーしています。データはBluetoothイヤホンを使用して録音され、市販の主要なモデルをカバーしており、録音設備の汎用性と適用性を保証しています。適用分野には、音声アシスタントの開発、スマートBluetoothイヤホンの機能最適化、音声指令制御アプリケーション、および音声認識アルゴリズムの研究が含まれます。弊社はデータ保護規制とプライバシー規定に厳格に従い、データ収集、保存、使用の過程でユーザーのプライバシーと法的権利が保護されるように、すべてのデータはGDPR、CCPA、 PIPLに準拠しています。

このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。

おすすめデータセット

48kHz・500時間高音質・話者分離日本語自然会話音声データセット

本データは、フルデュプレックス（全二重）対話を前提に収録した高品質な日本語音声データセットです。半二重方式では再現が難しい同時発話や重なり発話、自然な相槌や割込みを含み、双方向に同時進行する対話を再現した同時双方向音声データセットとして、リアルタイム対話AIや次世代ASRの研究開発に適しています。本セットは、提示されたトピックリストから収録者が複数の得意分野を選択し、自然な流れで会話を展開して収録した日本語自然会話音声データセットです。日本各地のネイティブ話者による多様な対話を含み、高音質収録によりASRの音響・言語モデル学習、声紋識別、対話システム評価など幅広い研究用途に活用できます。データは各種プライバシー保護規制に準拠して管理されています。当社の全二重音声データセットシリーズは、日本語をはじめ、英語、韓国語など多言語に対応し、書き起こしテキスト、発話タイムスタンプ、話者ID、性別などの詳細アノテーションを標準搭載しています。また、話者ごとの独立音声を含む話者分離音声データセットとしても利用可能で、収録条件や話者属性、ラベル仕様のカスタマイズ収集・作成にも柔軟に対応します。

日本語音声データ話者分離音声データ全二重音声データセット同時双方向音声データセット日本語自然会話音声データ

グジャラート語の脚本に基づいた会話音声データ

グジャラート語の脚本に基づいた会話音声データは、与えられた脚本に基づいて会話をシミュレーションし、録音したもので、複数の分野をカバーし、内容が豊富である。このデータセットには、テキスト内容などの多様な属性がラベリングされており、高い正確性を備えており、音声認識に関する研究や応用に豊富なリソースを提供している。複数のAI企業による検証結果、このデータはモデルが現実世界の多様性に直面した際に優れたパフォーマンスを発揮するのに役立つ。当社はデータ保護法規やプライバシーに関する規定を厳格に遵守し、データの収集、保存、利用の過程でユーザーのプライバシーと合法的な権益を守り、すべてのデータはGDPR、CCPA、PIPLに準拠している。

グジャラート語インド会話音声

300時間タガログ語スマートフォン収録音読音声データ

タガログ語音声データ_音読（スマートフォン）は、指定されたスクリプトに基づいて音読、録音をシミュレートしたもの。内容は会話·評論、インタラクティブ系、車載、ホームデバイスコマンド系と文字列等様々な分野を網羅し、豊富なコンテンツを有しました。本データセットはテキスト内容等、複数の属性をラベリングし、高い正確度を誇りながら、音声認識に関する研究とその応用に豊富なリソースを提供しています。複数のAI企業が検証したところ、本データセット現実世界の網羅性とバリデーションに面するモデルのパフォーマンス向上に貢献。当社はデータ保護法規およびプライバシー規則を厳守し、データセットや保存とその活用のプロセスでユーザーのプライバシーと合法的権益の保護に尽力します。全データはGDPR、CCPA、PIPLに準拠しています。タガログ語音声データ_音読（スマートフォン）は、指定されたスクリプトに基づいて音読、録音をシミュレートしたもの。内容は会話·評論、インタラクティブ系、車載、ホームデバイスコマンド系と文字列等様々な分野を網羅し、豊富なコンテンツを有しました。本データセットはテキスト内容等、複数の属性をラベリングし、高い正確度を誇りながら、音声認識に関する研究とその応用に豊富なリソースを提供しています。複数のAI企業が検証したところ、本データセット現実世界の網羅性とバリデーションに面するモデルのパフォーマンス向上に貢献。当社はデータ保護法規およびプライバシー規則を厳守し、データセットや保存とその活用のプロセスでユーザーのプライバシーと合法的権益の保護に尽力します。全データはGDPR、CCPA、PIPLに準拠しています。

タガログ語フィリピンスマートフォン音読台本付きモノローグ

グジャラート語スマートフォン収集の音読音声データ

インドグジャラート語音声データ_音読（スマートフォン）は、指定されたスクリプトに基づいて音読、録音をシミュレートしたもの。内容は会話·評論、インタラクティブ系、車載、ホームデバイスコマンド系と文字列等様々な分野を網羅し、豊富なコンテンツを有しました。本データセットはテキスト内容等、複数の属性をラベリングし、高い正確度を誇りながら、音声認識に関する研究とその応用に豊富なリソースを提供しています。複数のAI企業が検証したところ、本データセット現実世界の網羅性とバリデーションに面するモデルのパフォーマンス向上に貢献。当社はデータ保護法規およびプライバシー規則を厳守し、データセットや保存とその活用のプロセスでユーザーのプライバシーと合法的権益の保護に尽力します。全データはGDPR、CCPA、PIPLに準拠しています。

グジャラート語インドスマートフォン音読台本付きモノローグ

341時間のマレー語スマートフォン採集朗読音声データ

マレーシア・マレー語音声データ_朗読(スマートフォン）は、指定されたスクリプトに基づいて朗読し、シミュレートして録音されたデータです。チャットコメント、インタラクティブ系、、車載コマンド系、ホームデバイスコマンド系、数字列など、複数の分野をカバーしており、内容が豊富です。このデータセットには、テキスト内容などのさまざまな属性がラベル付けされており、高い精度を誇ります。音声認識関連の研究やアプリケーションに豊富なリソースを提供し、多くのAI企業によって確認されています。モデルがリアルワールドの多様性に対応する際に優れたパフォーマンスを発揮するのに役立ちます。データ収集、保存、使用においては、プライバシー保護法や規制を厳守し、ユーザーのプライバシーと合法的な権利を確保しています。すべてのデータはGDPR、CCPA、PIPLなどの規制に準拠しています。

マレー語マレーシアスマートフォン朗読台本付きモノローグ

19時間バスシーン騒音データ（録音ペン）

「Tascam DR-07 xによって記録された音声レコーダによって記録されたバスシーンノイズデータは、バスやバスプラットフォームシーンを含めて、リアルで複雑なタスクにおけるモデルの性能を高めています。複数の人工知能会社の品質テストを受けた。私たちはデータ保護法規とプライバシー基準を厳格に遵守し、データ収集、保存、使用中にユーザーのプライバシーと合法的な権利を維持することを確保し、私たちのデータセットはすべてGDPR、CCPA、PIPLに合致しています。

ノイズボイスレコーダーバスプラットフォーム

360時間のヨーロッパポルトガル語口語化音声データ

ヨーロッパポルトガル語口語化音声データ、内容は対話、インタビューなどの領域をカバーし、実世界のインタラクションシーンを反映しています。このデータセットはテキスト内容、話者識別、性別など多様な属性をアノテーションし、異なる地域や文化的背景を持つポルトガル現地人によって録音され、高精度で使いやすく、音声認識関連の研究やアプリケーションに豊富なリソースを提供します。モデルが実世界の多様性に対応するのに役立つことが複数のAI企業による検証で確認されています。データ保護法規とプライバシー規定を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと法的権利を保護します。すべてのデータはGDPR、CCPA、PIPLに準拠しています。

ポルトガル語ヨーロッパ

300時間のヨーロッパポルトガル語スマートフォン収集音声データ

ヨーロッパポルトガル語音読音声データ（スマートフォン）、指定されたスクリプトに基づいて音読をシミュレーション録音し、内容は豊富です。このデータセットはテキスト内容など多様な属性をアノテーションし、異なる地域や文化的背景を持つポルトガル現地人319名によって録音され、アクセントは正統で、テキストは人手で校正され、正解率が高く、音声認識関連の研究やアプリケーションに豊富なリソースを提供します。複数のAI企業による検証により、モデルが実世界の多様性に対応するのに役立つことが確認されています。データ保護法規とプライバシー規定を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと法的権利を保護します。すべてのデータはGDPR、CCPA、PIPLに準拠しています。

ポルトガル語