[{"@type":"PropertyValue","name":"フォーマット","value":"16kHz/16bit/非圧縮WAV/モノラル"},{"@type":"PropertyValue","name":"内容","value":"収録担当者が自由に会話する内容を、話者ごとに個別ファイルとして収録"},{"@type":"PropertyValue","name":"収録環境","value":"比較的静かな室内(残響・エコーなし)"},{"@type":"PropertyValue","name":"収録機器","value":"Androidスマートフォン/iPhone"},{"@type":"PropertyValue","name":"キャスト","value":"約200名"},{"@type":"PropertyValue","name":"国","value":"韓国"},{"@type":"PropertyValue","name":"言語","value":"韓国語"},{"@type":"PropertyValue","name":"アノテーション","value":"テキスト文字起こし、発話単位タイムスタンプ、話者識別情報、性別"},{"@type":"PropertyValue","name":"精度","value":"単語正解率 98%"}]
{"id":1704,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"200時間韓国語話者分離・自然会話音声データセット","datazy":[{"title":"フォーマット","content":"16kHz/16bit/非圧縮WAV/モノラル"},{"title":"内容","content":"収録担当者が自由に会話する内容を、話者ごとに個別ファイルとして収録"},{"title":"収録環境","content":"比較的静かな室内(残響・エコーなし)"},{"title":"収録機器","content":"Androidスマートフォン/iPhone"},{"title":"キャスト","content":"約200名"},{"title":"国","content":"韓国"},{"title":"言語","content":"韓国語"},{"title":"アノテーション","content":"テキスト文字起こし、発話単位タイムスタンプ、話者識別情報、性別"},{"title":"精度","content":"単語正解率 98%"}],"datatag":"korean,korea,multi-stream,Dialogue ,full duplex","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":null,"samplePresentation":[{"name":"00005_002_1_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_1_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=NlsqZnHGAvbSvVH1OEhwiTk5wzY%3D","intro":"오케이 오케이.","size":43724,"progress":100,"type":"mp3"},{"name":"00005_002_1_phone-3.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_1_phone-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=zkhIVWAhS3uKo2h%2BkJ%2BWwrsCANQ%3D","intro":"여행 여행 요즘 뭐 여행가고 싶은데 없어?","size":223820,"progress":100,"type":"mp3"},{"name":"00005_002_2_phone-1.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_2_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=SE4CYmf6ut37dAFxAogB7QNagKo%3D","intro":"어, 네, 저는 목소리가 엄청 작게 들리는데 원래 이런가?","size":160700,"progress":100,"type":"mp3"},{"name":"00005_002_2_phone-2.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_2_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=wNJqEzby78LskY9GS8bSn0VrYow%3D","intro":"아, 그래요? 이건 어쩔 수 없나 봐요, 끊기진 않은데 저는.","size":167180,"progress":100,"type":"mp3"},{"name":"00005_002_2_phone-6.wav","url":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_2_phone-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=eNXO3T2Q0J8MypsJ1mFZGhLYv1o%3D","intro":"저번에 여행 갔다 오고 나서 이제","size":153452,"progress":100,"type":"mp3"}],"officialSummary":"本データは、フルデュプレックス(全二重)対話を前提に収録した高品質な韓国語音声データセットです。半二重方式では再現が難しい同時発話や重なり発話、自然な相槌や割込みを含み、双方向に同時進行する対話を再現した同時双方向音声データセットとして、リアルタイム対話AIや次世代ASRの研究開発に適しています。本セットは、提示されたトピックリストから収録者が複数の得意分野を選択し、自然な流れで会話を展開して収録した韓国語自然会話音声データセットです。約200名の韓国ネイティブスピーカーによる多様な対話を含み、高音質収録によりASRの音響・言語モデル学習、声紋識別、対話システム評価など幅広い研究用途に活用できます。データは各種プライバシー保護規制に準拠して管理されています。当社の全二重音声データセットシリーズは、日本語をはじめ、英語、韓国語など多言語に対応し、書き起こしテキスト、発話タイムスタンプ、話者ID、性別などの詳細アノテーションを標準搭載しています。また、話者ごとの独立音声を含む話者分離音声データセットとしても利用可能で、収録条件や話者属性、ラベル仕様のカスタマイズ収集・作成にも柔軟に対応します。","dataexampl":null,"datakeyword":["韓国語音声データセット","韓国語自然会話音声データ","韓国語話者分離音声データ","韓国語音声認識データ"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES,JP\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"214 Hours - Korean(Korea) Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_1_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=NlsqZnHGAvbSvVH1OEhwiTk5wzY%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_1_phone-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=zkhIVWAhS3uKo2h%2BkJ%2BWwrsCANQ%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_2_phone-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=SE4CYmf6ut37dAFxAogB7QNagKo%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_2_phone-2.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=wNJqEzby78LskY9GS8bSn0VrYow%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/samplePresentation_ipad/20250709103104/00005_002_2_phone-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=eNXO3T2Q0J8MypsJ1mFZGhLYv1o%3D"}]
200時間韓国語話者分離・自然会話音声データセット
韓国語音声データセット
韓国語自然会話音声データ
韓国語話者分離音声データ
韓国語音声認識データ
本データは、フルデュプレックス(全二重)対話を前提に収録した高品質な韓国語音声データセットです。半二重方式では再現が難しい同時発話や重なり発話、自然な相槌や割込みを含み、双方向に同時進行する対話を再現した同時双方向音声データセットとして、リアルタイム対話AIや次世代ASRの研究開発に適しています。本セットは、提示されたトピックリストから収録者が複数の得意分野を選択し、自然な流れで会話を展開して収録した韓国語自然会話音声データセットです。約200名の韓国ネイティブスピーカーによる多様な対話を含み、高音質収録によりASRの音響・言語モデル学習、声紋識別、対話システム評価など幅広い研究用途に活用できます。データは各種プライバシー保護規制に準拠して管理されています。当社の全二重音声データセットシリーズは、日本語をはじめ、英語、韓国語など多言語に対応し、書き起こしテキスト、発話タイムスタンプ、話者ID、性別などの詳細アノテーションを標準搭載しています。また、話者ごとの独立音声を含む話者分離音声データセットとしても利用可能で、収録条件や話者属性、ラベル仕様のカスタマイズ収集・作成にも柔軟に対応します。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
フォーマット
16kHz/16bit/非圧縮WAV/モノラル
内容
収録担当者が自由に会話する内容を、話者ごとに個別ファイルとして収録
収録機器
Androidスマートフォン/iPhone
アノテーション
テキスト文字起こし、発話単位タイムスタンプ、話者識別情報、性別
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

日本語の音声認識データにはどのようなバリエーションがありますか?

子どもの日常会話、モノローグ、講義、バラエティなど幅広いジャンルを含むリアルな対話音声が収録されており、話者 ID、性別、年齢、アクセントなどもアノテーションされています。

データの多様性は実際のユースケースに役立ちますか?

はい、リアルな対話と幅広い話者属性を収録しており、日本のさまざまな環境での音声認識モデルに対応可能です。

納品までのスピードはどの程度ですか?

既製データセットは最短1日で納品可能で、カスタム収集・アノテーションも迅速対応可能です。
ae99f87c-2281-4bad-b43d-c114d272c653