[{"@type":"PropertyValue","name":"フォーマット","value":"24kHz, 16 bit, wav, モノラルチャンネル"},{"@type":"PropertyValue","name":"音声コンテンツ","value":"与えられたトピックに基づく自由対話"},{"@type":"PropertyValue","name":"収集環境","value":"室内静かな環境"},{"@type":"PropertyValue","name":"収集設備","value":"Android スマホ, iPhone"},{"@type":"PropertyValue","name":"話者","value":"200人"},{"@type":"PropertyValue","name":"国","value":"日本"},{"@type":"PropertyValue","name":"言語","value":"日本語"},{"@type":"PropertyValue","name":"アノテーション特徴","value":"会話内容、話者ID、性別、年齢などの属性を転写"},{"@type":"PropertyValue","name":"正確率","value":"文単位正確率(SAR)95%"}]
{"id":1703,"datatype":"1","titleimg":"https://storage-product.datatang.com/damp/product/dataExampleImg/20251021140248/%E6%9C%AA%E5%91%BD%E5%90%8D%E7%9A%84%E8%AE%BE%E8%AE%A1%20%2815%29.png?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=gw7BM2roBXZXdy%2B6GE1sTI1dEFc%3D","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"日本語LR分離自然会話スマートフォン音声データセット","datazy":[{"title":"フォーマット","content":"24kHz, 16 bit, wav, モノラルチャンネル"},{"title":"音声コンテンツ","content":"与えられたトピックに基づく自由対話"},{"title":"収集環境","content":"室内静かな環境"},{"title":"収集設備","content":"Android スマホ, iPhone"},{"title":"話者","content":"200人"},{"title":"国","content":"日本"},{"title":"言語","content":"日本語"},{"title":"アノテーション特徴","content":"会話内容、話者ID、性別、年齢などの属性を転写"},{"title":"正確率","content":"文単位正確率(SAR)95%"}],"datatag":"Japanese,Japan,Dialogue,Full-Duplex","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":null,"samplePresentation":[{"name":"G00033S0019_O1_9.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O1_9.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=g4aYYPMbEEGq1o%2FKzMEuayWuSF8%3D","intro":"徳川綱吉で、ですかね、覚えて[OVERLAP/]いま[/OVERLAP]すか。","size":207346,"progress":100,"type":"mp3"},{"name":"G00033S0019_O1_1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O1_1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=TJysfMzWL9uOkWb1wVG%2B3hTkQOY%3D","intro":"なんかすいません、切れちゃってごめんなさい。","size":78680,"progress":100,"type":"mp3"},{"name":"G00033S0019_O2_17.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O2_17.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=8oNd5jsAJtQd42ajkgUjU%2F9Aah4%3D","intro":"旅行、行った時とかに見たりするんですか?[N]","size":137764,"progress":100,"type":"mp3"},{"name":"G00033S0019_O2_19.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O2_19.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=ZSbdBl5mI9p3aoDX9vMG1TVRjQs%3D","intro":"え、なんか印象に残ってるとか良かったお城あったりしますか。","size":203126,"progress":100,"type":"mp3"}],"officialSummary":"本データセットは、指定されたトピックに基づく自然な会話から収集された、日本語(日本)のフルデュプレックス対話音声です。テキスト内容に加え、話者ID、性別、年齢などのメタ情報を含み、AIモデルのトレーニング・評価に最適な構造となっています。収集にあたっては、日本全国の多様な地域・バックグラウンドを持つ幅広い話者層を対象とし、実世界の複雑で多様な対話シナリオにおけるモデル性能の向上を実現しています。本データセットは、複数のAI企業による品質評価を経ており、高信頼性・高再現性が実証済みです。","dataexampl":null,"datakeyword":["日本語","音声","LR分離","マルチストリーム","自然会話"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O1_9.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=g4aYYPMbEEGq1o%2FKzMEuayWuSF8%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O1_1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=TJysfMzWL9uOkWb1wVG%2B3hTkQOY%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O2_17.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=8oNd5jsAJtQd42ajkgUjU%2F9Aah4%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250722160934/G00033S0019_O2_19.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=ZSbdBl5mI9p3aoDX9vMG1TVRjQs%3D"}]
日本語LR分離自然会話スマートフォン音声データセット
日本語
音声
LR分離
マルチストリーム
自然会話
本データセットは、指定されたトピックに基づく自然な会話から収集された、日本語(日本)のフルデュプレックス対話音声です。テキスト内容に加え、話者ID、性別、年齢などのメタ情報を含み、AIモデルのトレーニング・評価に最適な構造となっています。収集にあたっては、日本全国の多様な地域・バックグラウンドを持つ幅広い話者層を対象とし、実世界の複雑で多様な対話シナリオにおけるモデル性能の向上を実現しています。本データセットは、複数のAI企業による品質評価を経ており、高信頼性・高再現性が実証済みです。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
フォーマット
24kHz, 16 bit, wav, モノラルチャンネル
アノテーション特徴
会話内容、話者ID、性別、年齢などの属性を転写
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

日本語の音声認識データにはどのようなバリエーションがありますか?

子どもの日常会話、モノローグ、講義、バラエティなど幅広いジャンルを含むリアルな対話音声が収録されており、話者 ID、性別、年齢、アクセントなどもアノテーションされています。

データの多様性は実際のユースケースに役立ちますか?

はい、リアルな対話と幅広い話者属性を収録しており、日本のさまざまな環境での音声認識モデルに対応可能です。

納品までのスピードはどの程度ですか?

既製データセットは最短1日で納品可能で、カスタム収集・アノテーションも迅速対応可能です。
ab5bcc51-41c1-40a9-bd7f-f2f75d6fb3b1