[{"@type":"PropertyValue","name":"フォーマット","value":"16kHz/16bit/非圧縮WAV/モノラル/話者別チャンネル分離"},{"@type":"PropertyValue","name":"収録環境","value":"比較的静かな室内(残響・エコーなし)"},{"@type":"PropertyValue","name":"収録内容","value":"話題リストを事前に用意し、収録担当者が自身に馴染みのある話題を複数選択。各話題について自然な会話形式で収録を実施"},{"@type":"PropertyValue","name":"キャスト","value":"398名のフィリピン現地ネイティブスピーカー"},{"@type":"PropertyValue","name":"アノテーション","value":"有効な単文を抽出してアノテーションを実施。アノテーション結果には、有効単文の開始・終了タイムスタンプ、話者識別情報、テキスト文字起こしを含む。ノイズアノテーションも実施"},{"@type":"PropertyValue","name":"国","value":"フィリピン"},{"@type":"PropertyValue","name":"言語","value":"英語"},{"@type":"PropertyValue","name":"活用シーン","value":"音声認識;声紋識別"},{"@type":"PropertyValue","name":"精度","value":"単語正解率 98%"}]
{"id":1771,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"423時間フィリピン英語話者分離・自然会話音声データセット","datazy":[{"title":"フォーマット","content":"16kHz/16bit/非圧縮WAV/モノラル/話者別チャンネル分離"},{"title":"収録環境","content":"比較的静かな室内(残響・エコーなし)"},{"title":"収録内容","content":"話題リストを事前に用意し、収録担当者が自身に馴染みのある話題を複数選択。各話題について自然な会話形式で収録を実施"},{"title":"キャスト","content":"398名のフィリピン現地ネイティブスピーカー"},{"title":"アノテーション","content":"有効な単文を抽出してアノテーションを実施。アノテーション結果には、有効単文の開始・終了タイムスタンプ、話者識別情報、テキスト文字起こしを含む。ノイズアノテーションも実施"},{"title":"国","content":"フィリピン"},{"title":"言語","content":"英語"},{"title":"活用シーン","content":"音声認識;声紋識別"},{"title":"精度","content":"単語正解率 98%"}],"datatag":"full-duplex,Dialogue","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":null,"samplePresentation":[],"officialSummary":"本データは、フルデュプレックス(全二重)対話を前提に収録した高品質なフィリピン英語音声データセットです。半二重方式では再現が難しい同時発話や重なり発話、自然な相槌や割込みを含み、双方向に同時進行する対話を再現した同時双方向音声データセットとして、リアルタイム対話AIや次世代ASRの研究開発に適しています。本セットは、提示されたトピックリストから収録者が複数の得意分野を選択し、自然な流れで会話を展開して収録したフィリピン英語自然会話音声データセットです。約800名のフィリピン現地ネイティブスピーカーによる多様な対話を含み、高音質収録によりASRの音響・言語モデル学習、声紋識別、対話システム評価など幅広い研究用途に活用できます。データは各種プライバシー保護規制に準拠して管理されています。当社の全二重音声データセットシリーズは、日本語をはじめ、英語、韓国語など多言語に対応し、書き起こしテキスト、発話タイムスタンプ、話者ID、性別などの詳細アノテーションを標準搭載しています。また、話者ごとの独立音声を含む話者分離音声データセットとしても利用可能で、収録条件や話者属性、ラベル仕様のカスタマイズ収集・作成にも柔軟に対応します。","dataexampl":null,"datakeyword":["英語自然会話音声データセット","フィリピン英語音声データ","フィリピン英語話者分離音声データ"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES,JP\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"423 Hours - English(Philippine) Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[]
423時間フィリピン英語話者分離・自然会話音声データセット
英語自然会話音声データセット
フィリピン英語音声データ
フィリピン英語話者分離音声データ
本データは、フルデュプレックス(全二重)対話を前提に収録した高品質なフィリピン英語音声データセットです。半二重方式では再現が難しい同時発話や重なり発話、自然な相槌や割込みを含み、双方向に同時進行する対話を再現した同時双方向音声データセットとして、リアルタイム対話AIや次世代ASRの研究開発に適しています。本セットは、提示されたトピックリストから収録者が複数の得意分野を選択し、自然な流れで会話を展開して収録したフィリピン英語自然会話音声データセットです。約800名のフィリピン現地ネイティブスピーカーによる多様な対話を含み、高音質収録によりASRの音響・言語モデル学習、声紋識別、対話システム評価など幅広い研究用途に活用できます。データは各種プライバシー保護規制に準拠して管理されています。当社の全二重音声データセットシリーズは、日本語をはじめ、英語、韓国語など多言語に対応し、書き起こしテキスト、発話タイムスタンプ、話者ID、性別などの詳細アノテーションを標準搭載しています。また、話者ごとの独立音声を含む話者分離音声データセットとしても利用可能で、収録条件や話者属性、ラベル仕様のカスタマイズ収集・作成にも柔軟に対応します。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
フォーマット
16kHz/16bit/非圧縮WAV/モノラル/話者別チャンネル分離
収録内容
話題リストを事前に用意し、収録担当者が自身に馴染みのある話題を複数選択。各話題について自然な会話形式で収録を実施
キャスト
398名のフィリピン現地ネイティブスピーカー
アノテーション
有効な単文を抽出してアノテーションを実施。アノテーション結果には、有効単文の開始・終了タイムスタンプ、話者識別情報、テキスト文字起こしを含む。ノイズアノテーションも実施
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

日本語の音声認識データにはどのようなバリエーションがありますか?

子どもの日常会話、モノローグ、講義、バラエティなど幅広いジャンルを含むリアルな対話音声が収録されており、話者 ID、性別、年齢、アクセントなどもアノテーションされています。

データの多様性は実際のユースケースに役立ちますか?

はい、リアルな対話と幅広い話者属性を収録しており、日本のさまざまな環境での音声認識モデルに対応可能です。

納品までのスピードはどの程度ですか?

既製データセットは最短1日で納品可能で、カスタム収集・アノテーションも迅速対応可能です。
fbdb0d5a-8b32-4c5d-a03b-dbf45f978988