[{"@type":"PropertyValue","name":"フォーマット","value":"48kHz/32bit/非圧縮WAV/モノラル"},{"@type":"PropertyValue","name":"内容","value":"収録者同士の自由会話。各話者ごとに個別の音声ファイルとして収録"},{"@type":"PropertyValue","name":"収録環境","value":"比較的静かな室内環境(残響・反響なし)"},{"@type":"PropertyValue","name":"収録機材","value":"高性能コンデンサーマイク"},{"@type":"PropertyValue","name":"収録国","value":"日本"},{"@type":"PropertyValue","name":"言語","value":"日本語"},{"@type":"PropertyValue","name":"アノテーション内容","value":"書き起こしテキスト、発話タイムスタンプ、話者ID、性別情報"},{"@type":"PropertyValue","name":"文字正解率","value":"98%"}]
{"id":1971,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"48kHz・500時間高音質・話者分離日本語自然会話音声データセット","datazy":[{"title":"フォーマット","content":"48kHz/32bit/非圧縮WAV/モノラル"},{"title":"内容","content":"収録者同士の自由会話。各話者ごとに個別の音声ファイルとして収録"},{"title":"収録環境","content":"比較的静かな室内環境(残響・反響なし)"},{"title":"収録機材","content":"高性能コンデンサーマイク"},{"title":"収録国","content":"日本"},{"title":"言語","content":"日本語"},{"title":"アノテーション内容","content":"書き起こしテキスト、発話タイムスタンプ、話者ID、性別情報"},{"title":"文字正解率","content":"98%"}],"datatag":"Japanese,Japan,Dialogue,Full-Duplex,48khz","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":null,"samplePresentation":[{"name":"G01000S0004_O2_9.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20260106141227/G01000S0004_O2_9.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=jkSO%2FFGIkmxMVcJRlzvQz40mi80%3D","intro":"[OVERLAP/]うん[/OVERLAP]うんってなるやつがすごく多い、のがあって。","size":959764,"progress":100,"type":"mp3"},{"name":"G01000S0035_O1_7.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20260106141227/G01000S0035_O1_7.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=mNTiZgZO4OpR2spwPwSBOEGE4wo%3D","intro":"うん。[N]","size":175076,"progress":100,"type":"mp3"},{"name":"G01000S0026_O2_14.wav","url":"https://storage-product.datatang.com/damp/product/instructions_zh/20260106141227/G01000S0026_O2_14.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=lL41XUPY%2FwJJ0iYbixutcC5W%2BMA%3D","intro":"二回やるみたいな、イメージでやったら、[OVERLAP/]もう[/OVERLAP]ちょっと落ちやすいかな。","size":1199620,"progress":100,"type":"mp3"}],"officialSummary":"48kHzの高音質マイク環境で収録された、日本語2話者による500時間の2話者自然会話音声データセット。日常的なテーマに基づく対話を中心に、同時発話や重なり発話を含む実環境に近い会話音声を収録しており、話者ごとに分離された音声データと詳細なアノテーションを提供します。各発話には書き起こしテキスト、タイムスタンプ、話者ID、性別などの情報が付与されており、音声認識(ASR)、音声分離、スピーカーダイアリゼーション、音声対話AI、コールセンター分析など幅広い用途に対応可能です。日本各地域のネイティブ話者による収録により多様性を確保し、実運用環境に近い学習データとして利用できます。すべてのデータはGDPR、CCPA、PIPLに準拠して収集・管理されています。","dataexampl":null,"datakeyword":["日本語音声データ","話者分離音声データ","日本語自然会話","日本語学習用データ"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"500 Hours - Japanese(Japan) 48khz Full-Duplex Spontaneous Dialogue Microphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20260106141227/G01000S0004_O2_9.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=jkSO%2FFGIkmxMVcJRlzvQz40mi80%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20260106141227/G01000S0035_O1_7.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=mNTiZgZO4OpR2spwPwSBOEGE4wo%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/instructions_zh/20260106141227/G01000S0026_O2_14.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=lL41XUPY%2FwJJ0iYbixutcC5W%2BMA%3D"}]
48kHz・500時間高音質・話者分離日本語自然会話音声データセット
日本語音声データ
話者分離音声データ
日本語自然会話
日本語学習用データ
48kHzの高音質マイク環境で収録された、日本語2話者による500時間の2話者自然会話音声データセット。日常的なテーマに基づく対話を中心に、同時発話や重なり発話を含む実環境に近い会話音声を収録しており、話者ごとに分離された音声データと詳細なアノテーションを提供します。各発話には書き起こしテキスト、タイムスタンプ、話者ID、性別などの情報が付与されており、音声認識(ASR)、音声分離、スピーカーダイアリゼーション、音声対話AI、コールセンター分析など幅広い用途に対応可能です。日本各地域のネイティブ話者による収録により多様性を確保し、実運用環境に近い学習データとして利用できます。すべてのデータはGDPR、CCPA、PIPLに準拠して収集・管理されています。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
フォーマット
48kHz/32bit/非圧縮WAV/モノラル
内容
収録者同士の自由会話。各話者ごとに個別の音声ファイルとして収録
アノテーション内容
書き起こしテキスト、発話タイムスタンプ、話者ID、性別情報
![サンプル]()
サンプル
Audio
[OVERLAP/]うん[/OVERLAP]うんってなるやつがすごく多い、のがあって。
Audio
Audio
二回やるみたいな、イメージでやったら、[OVERLAP/]もう[/OVERLAP]ちょっと落ちやすいかな。
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

日本語の音声認識データにはどのようなバリエーションがありますか?

子どもの日常会話、モノローグ、講義、バラエティなど幅広いジャンルを含むリアルな対話音声が収録されており、話者 ID、性別、年齢、アクセントなどもアノテーションされています。

データの多様性は実際のユースケースに役立ちますか?

はい、リアルな対話と幅広い話者属性を収録しており、日本のさまざまな環境での音声認識モデルに対応可能です。

納品までのスピードはどの程度ですか?

既製データセットは最短1日で納品可能で、カスタム収集・アノテーションも迅速対応可能です。
1f338065-6859-4e0c-b00a-af2cc35f82a4