[{"@type":"PropertyValue","name":"フォーマット","value":"24kHz, 16 bit, wav, モノラルチャンネル"},{"@type":"PropertyValue","name":"音声コンテンツ","value":"与えられたトピックに基づく自由対話"},{"@type":"PropertyValue","name":"収集環境","value":"室内静かな環境"},{"@type":"PropertyValue","name":"収集設備","value":"Android スマホ, iPhone"},{"@type":"PropertyValue","name":"話者","value":"234人"},{"@type":"PropertyValue","name":"国","value":"日本"},{"@type":"PropertyValue","name":"言語","value":"日本語"},{"@type":"PropertyValue","name":"アノテーション特徴","value":"会話内容、話者ID、性別、年齢などの属性を転写"},{"@type":"PropertyValue","name":"正確率","value":"文字正確率(CAR) 98%"}]
{"id":1703,"datatype":"1","titleimg":"https://storage-product.datatang.com/damp/product/dataExampleImg/20251021140248/%E6%9C%AA%E5%91%BD%E5%90%8D%E7%9A%84%E8%AE%BE%E8%AE%A1%20%2815%29.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=gw7BM2roBXZXdy%2B6GE1sTI1dEFc%3D","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"205時間話者分離日本語自然会話音声データセット","datazy":[{"title":"フォーマット","content":"24kHz, 16 bit, wav, モノラルチャンネル"},{"title":"音声コンテンツ","content":"与えられたトピックに基づく自由対話"},{"title":"収集環境","content":"室内静かな環境"},{"title":"収集設備","content":"Android スマホ, iPhone"},{"title":"話者","content":"234人"},{"title":"国","content":"日本"},{"title":"言語","content":"日本語"},{"title":"アノテーション特徴","content":"会話内容、話者ID、性別、年齢などの属性を転写"},{"title":"正確率","content":"文字正確率(CAR) 98%"}],"datatag":"Japanese,Japan,Dialogue,Full-Duplex","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":null,"samplePresentation":[{"name":"G00033S0019_O1_9.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O1_9.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=g4aYYPMbEEGq1o%2FKzMEuayWuSF8%3D","intro":"徳川綱吉で、ですかね、覚えて[OVERLAP/]いま[/OVERLAP]すか。","size":207346,"progress":100,"type":"mp3"},{"name":"G00033S0019_O1_1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O1_1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=TJysfMzWL9uOkWb1wVG%2B3hTkQOY%3D","intro":"なんかすいません、切れちゃってごめんなさい。","size":78680,"progress":100,"type":"mp3"},{"name":"G00033S0019_O2_17.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O2_17.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=8oNd5jsAJtQd42ajkgUjU%2F9Aah4%3D","intro":"旅行、行った時とかに見たりするんですか?[N]","size":137764,"progress":100,"type":"mp3"},{"name":"G00033S0019_O2_19.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O2_19.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=ZSbdBl5mI9p3aoDX9vMG1TVRjQs%3D","intro":"え、なんか印象に残ってるとか良かったお城あったりしますか。","size":203126,"progress":100,"type":"mp3"}],"officialSummary":"本データは、フルデュプレックス(全二重)対話を前提に収録した高品質な日本語音声データセットです。有効時間205時間。半二重方式では再現が難しい同時発話や重なり発話、自然な相槌や割込みを含み、双方向に同時進行する対話を再現した同時双方向音声データセットとして、リアルタイム対話AIや次世代ASRの研究開発に適しています。そして、本セットは提示されたトピックリストから収録者が複数の得意分野を選択し、自然な流れで会話を展開して収録した日本語自然会話音声データセットです。日本各地のネイティブ話者による多様な対話を含み、高音質収録によりASRの音響・言語モデル学習、声紋識別、対話システム評価など幅広い研究用途に活用できます。データは各種プライバシー保護規制に準拠して管理されています。 当社の全二重音声データセットシリーズは、日本語をはじめ、英語、韓国語など多言語に対応し、書き起こしテキスト、発話タイムスタンプ、話者ID、性別などの詳細アノテーションを標準搭載しています。また、話者ごとの独立音声を含む話者分離音声データセットとしても利用可能で、収録条件や話者属性、ラベル仕様のカスタマイズ収集・作成にも柔軟に対応します。","dataexampl":null,"datakeyword":["日本語音声データ","話者分離音声データ","全二重音声データセット","同時双方向音声データセット","日本語自然会話音声データ"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"205 Hours - Japanese(Japan) Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O1_9.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=g4aYYPMbEEGq1o%2FKzMEuayWuSF8%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O1_1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=TJysfMzWL9uOkWb1wVG%2B3hTkQOY%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O2_17.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=8oNd5jsAJtQd42ajkgUjU%2F9Aah4%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O2_19.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=ZSbdBl5mI9p3aoDX9vMG1TVRjQs%3D"}]
205時間話者分離日本語自然会話音声データセット
日本語音声データ
話者分離音声データ
全二重音声データセット
同時双方向音声データセット
日本語自然会話音声データ
本データは、フルデュプレックス(全二重)対話を前提に収録した高品質な日本語音声データセットです。有効時間205時間。半二重方式では再現が難しい同時発話や重なり発話、自然な相槌や割込みを含み、双方向に同時進行する対話を再現した同時双方向音声データセットとして、リアルタイム対話AIや次世代ASRの研究開発に適しています。そして、本セットは提示されたトピックリストから収録者が複数の得意分野を選択し、自然な流れで会話を展開して収録した日本語自然会話音声データセットです。日本各地のネイティブ話者による多様な対話を含み、高音質収録によりASRの音響・言語モデル学習、声紋識別、対話システム評価など幅広い研究用途に活用できます。データは各種プライバシー保護規制に準拠して管理されています。 当社の全二重音声データセットシリーズは、日本語をはじめ、英語、韓国語など多言語に対応し、書き起こしテキスト、発話タイムスタンプ、話者ID、性別などの詳細アノテーションを標準搭載しています。また、話者ごとの独立音声を含む話者分離音声データセットとしても利用可能で、収録条件や話者属性、ラベル仕様のカスタマイズ収集・作成にも柔軟に対応します。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
フォーマット
24kHz, 16 bit, wav, モノラルチャンネル
アノテーション特徴
会話内容、話者ID、性別、年齢などの属性を転写
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

日本語の音声認識データにはどのようなバリエーションがありますか?

子どもの日常会話、モノローグ、講義、バラエティなど幅広いジャンルを含むリアルな対話音声が収録されており、話者 ID、性別、年齢、アクセントなどもアノテーションされています。

データの多様性は実際のユースケースに役立ちますか?

はい、リアルな対話と幅広い話者属性を収録しており、日本のさまざまな環境での音声認識モデルに対応可能です。

納品までのスピードはどの程度ですか?

既製データセットは最短1日で納品可能で、カスタム収集・アノテーションも迅速対応可能です。
b5a7867b-225e-4ee6-aa80-33c1f4ff1f34