「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

491人の命令語音声データ_音読(Bluetoothイヤホン)

命令語
音声アシスタント
車載音声データ
命令語音声データセット

命令語のBluetoothイヤホンによる音声データ収集は、491名の中国本土の話者から行われ、各話者は同じ内容のコーパスを録音します。コーパスの内容は17件の一般的な命令語です。話者の男女比は均等で、複数の年齢層をカバーしています。データはBluetoothイヤホンを使用して録音され、市販の主要なモデルをカバーしており、録音設備の汎用性と適用性を保証しています。適用分野には、音声アシスタントの開発、スマートBluetoothイヤホンの機能最適化、音声指令制御アプリケーション、および音声認識アルゴリズムの研究が含まれます。弊社はデータ保護規制とプライバシー規定に厳格に従い、データ収集、保存、使用の過程でユーザーのプライバシーと法的権利が保護されるように、すべてのデータはGDPR、CCPA、 PIPLに準拠しています。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
フォーマット
16kHz、16bit、非圧縮wav、モノラル
録音環境
静かな室内、エコーなし
録音内容
音楽を再生する', '再生を開始する', '音楽を一時停止する', '再生を一時停止する', '音楽を停止する', '再生を停止する', '電話に出る', '電話を切る', '音量を上げる', '音量を大きくする', '音量を下げる', '音量を小さくする', '前の曲に戻る', '前の曲', '次の曲に進む', '次の曲', '音楽をお気に入りに追加する' の17の一般的な命令語を含みます
人員
491人(男女1:1)、話者の年齢層は9歳から60歳まで幅広くカバー
設備
複数のモデルのTWS Bluetoothイヤホン
言語
中国標準語
言語地域コード
zh-CN
中国
応用シーン
音声認識、声紋認識
サンプル サンプル
  • Audio

    开始播放

  • Audio

    播放音乐

  • Audio

    暂停播放

  • Audio

    暂停音乐

  • Audio

    停止播放

おすすめデータセットおすすめデータセット
48kHz・500時間高音質・話者分離日本語自然会話音声データセット

本データは、フルデュプレックス(全二重)対話を前提に収録した高品質な日本語音声データセットです。半二重方式では再現が難しい同時発話や重なり発話、自然な相槌や割込みを含み、双方向に同時進行する対話を再現した同時双方向音声データセットとして、リアルタイム対話AIや次世代ASRの研究開発に適しています。本セットは、提示されたトピックリストから収録者が複数の得意分野を選択し、自然な流れで会話を展開して収録した日本語自然会話音声データセットです。日本各地のネイティブ話者による多様な対話を含み、高音質収録によりASRの音響・言語モデル学習、声紋識別、対話システム評価など幅広い研究用途に活用できます。データは各種プライバシー保護規制に準拠して管理されています。当社の全二重音声データセットシリーズは、日本語をはじめ、英語、韓国語など多言語に対応し、書き起こしテキスト、発話タイムスタンプ、話者ID、性別などの詳細アノテーションを標準搭載しています。また、話者ごとの独立音声を含む話者分離音声データセットとしても利用可能で、収録条件や話者属性、ラベル仕様のカスタマイズ収集・作成にも柔軟に対応します。

日本語音声データ 話者分離音声データ 全二重音声データセット 同時双方向音声データセット 日本語自然会話音声データ
300時間タガログ語スマートフォン収録音読音声データ

タガログ語音声データ_音読(スマートフォン)は、指定されたスクリプトに基づいて音読、録音をシミュレートしたもの。内容は会話·評論、インタラクティブ系、車載、ホームデバイスコマンド系と文字列等様々な分野を網羅し、豊富なコンテンツを有しました。本データセットはテキスト内容等、複数の属性をラベリングし、高い正確度を誇りながら、音声認識に関する研究とその応用に豊富なリソースを提供しています。複数のAI企業が検証したところ、本データセット現実世界の網羅性とバリデーションに面するモデルのパフォーマンス向上に貢献。当社はデータ保護法規およびプライバシー規則を厳守し、データセットや保存とその活用のプロセスでユーザーのプライバシーと合法的権益の保護に尽力します。全データはGDPR、CCPA、PIPLに準拠しています。 タガログ語音声データ_音読(スマートフォン)は、指定されたスクリプトに基づいて音読、録音をシミュレートしたもの。内容は会話·評論、インタラクティブ系、車載、ホームデバイスコマンド系と文字列等様々な分野を網羅し、豊富なコンテンツを有しました。本データセットはテキスト内容等、複数の属性をラベリングし、高い正確度を誇りながら、音声認識に関する研究とその応用に豊富なリソースを提供しています。複数のAI企業が検証したところ、本データセット現実世界の網羅性とバリデーションに面するモデルのパフォーマンス向上に貢献。当社はデータ保護法規およびプライバシー規則を厳守し、データセットや保存とその活用のプロセスでユーザーのプライバシーと合法的権益の保護に尽力します。全データはGDPR、CCPA、PIPLに準拠しています。

タガログ語 フィリピン スマートフォン 音読 台本付きモノローグ
ご要望をご相談ください

プロジェクトの成熟度

初期検討段階(具体的な仕様は未定)
目標は明確だが、専門的な支援が必要
開発中または最適化フェーズ
データ/アノテーションの専門チーム(明確な仕様あり)

プライバシー保護 に同意する

よくあるご質問

日本語の音声認識データにはどのようなバリエーションがありますか?

子どもの日常会話、モノローグ、講義、バラエティなど幅広いジャンルを含むリアルな対話音声が収録されており、話者 ID、性別、年齢、アクセントなどもアノテーションされています。

データの多様性は実際のユースケースに役立ちますか?

はい、リアルな対話と幅広い話者属性を収録しており、日本のさまざまな環境での音声認識モデルに対応可能です。

納品までのスピードはどの程度ですか?

既製データセットは最短1日で納品可能で、カスタム収集・アノテーションも迅速対応可能です。

b171c5c9-aadb-4f78-96e4-5e6e56d9e979

ad7b4804-2a96-4b0c-ba80-658ea848cb43