[{"@type":"PropertyValue","name":"フォーマット","value":"16kHz、16bit、非圧縮WAV、モノラル"},{"@type":"PropertyValue","name":"コンテンツ分類","value":"録音者による自由会話、自然で流暢な対話の収録"},{"@type":"PropertyValue","name":"収録環境","value":"比較的静かな室内、残響・反響のない環境"},{"@type":"PropertyValue","name":"使用デバイス","value":"Android端末、iPhone"},{"@type":"PropertyValue","name":"録音者情報","value":"合計654名(男性183名、女性471名)"},{"@type":"PropertyValue","name":"対象国","value":"タイ"},{"@type":"PropertyValue","name":"言語","value":"タイ語"},{"@type":"PropertyValue","name":"アノテーション項目","value":"テキスト内容、発話タイムスタンプ、話者識別、性別"},{"@type":"PropertyValue","name":"精度","value":"単語正解率98%"}]
{"id":1594,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"166","type2str":null,"dataname":"211時間タイ語話者分離自然会話音声データセット","datazy":[{"title":"フォーマット","content":"16kHz、16bit、非圧縮WAV、モノラル"},{"title":"コンテンツ分類","content":"録音者による自由会話、自然で流暢な対話の収録"},{"title":"収録環境","content":"比較的静かな室内、残響・反響のない環境"},{"title":"使用デバイス","content":"Android端末、iPhone"},{"title":"録音者情報","content":"合計654名(男性183名、女性471名)"},{"title":"対象国","content":"タイ"},{"title":"言語","content":"タイ語"},{"title":"アノテーション項目","content":"テキスト内容、発話タイムスタンプ、話者識別、性別"},{"title":"精度","content":"単語正解率98%"}],"datatag":"thai,Dialogue ,full duplex","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":null,"samplePresentation":[{"name":"0001_001_A-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_A-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=bWqqa7r0%2BO1wQKcLI5kYoiDMOGE%3D","intro":"คนหนีไปเติมต่าง นอกต่างประเทศมา มาเลถูกกว่าเท่าตัว","size":222828,"progress":100,"type":"mp3"},{"name":"0001_001_A-3.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_A-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=HVBcGXkQEAxfoOdM40GKFaiGH10%3D","intro":"มึงขับแก๊สนั่นแก๊สหรือว่ารถน้ำมันรถไฟฟ้า","size":174764,"progress":100,"type":"mp3"},{"name":"0001_001_A-6.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_A-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=3gLRPgSTnWGSTLPtvFlGbdX91zA%3D","intro":"มึงต้องไปเติมมาเลเซียน้ำมันไม่แพง","size":143692,"progress":100,"type":"mp3"},{"name":"0001_001_B-1.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_B-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=jCQM%2BMSDHXfHWOE5MqxTDWXXyKQ%3D","intro":"อือน้ำมันแพงด้วย","size":146796,"progress":100,"type":"mp3"},{"name":"0001_001_B-10.wav","url":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_B-10.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=f83CovJuK5JqYXe0hD7czI0l%2FRw%3D","intro":"ยังทำถนนยังไม่เสร็จอีกเหรอนี่","size":95628,"progress":100,"type":"mp3"}],"officialSummary":"本データは、フルデュプレックス(全二重)対話を前提に収録した高品質なタイ語音声データセットです。有効時間211時間。半二重方式では再現が難しい同時発話や重なり発話、自然な相槌や割込みを含み、双方向に同時進行する対話を再現した同時双方向音声データセットとして、リアルタイム対話AIや次世代ASRの研究開発に適しています。そして、本セットは提示されたトピックリストから収録者が複数の得意分野を選択し、自然な流れで会話を展開して収録したタイ語自然会話音声データセットです。タイ各地のネイティブ話者による多様な対話を含み、高音質収録によりASRの音響・言語モデル学習、声紋識別、対話システム評価など幅広い研究用途に活用できます。データは各種プライバシー保護規制に準拠して管理されています。 当社の全二重音声データセットシリーズは、日本語をはじめ、英語、韓国語など多言語に対応し、書き起こしテキスト、発話タイムスタンプ、話者ID、性別などの詳細アノテーションを標準搭載しています。また、話者ごとの独立音声を含む話者分離音声データセットとしても利用可能で、収録条件や話者属性、ラベル仕様のカスタマイズ収集・作成にも柔軟に対応します。","dataexampl":null,"datakeyword":["タイ語音声データセット","タイ語自然会話音声データ","タイ語話者分離音声データ","タイ語音声認識データセット"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Data Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechRec","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,PT,DE,KO,FR,ES,JP\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"211 Hours - Thai(Thailand) Full-Duplex Spontaneous Dialogue Smartphone speech dataset","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_A-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=bWqqa7r0%2BO1wQKcLI5kYoiDMOGE%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_A-3.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=HVBcGXkQEAxfoOdM40GKFaiGH10%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_A-6.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=3gLRPgSTnWGSTLPtvFlGbdX91zA%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_B-1.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=jCQM%2BMSDHXfHWOE5MqxTDWXXyKQ%3D"},{"@type":"AudioObject","embedUrl":"https://storage-product.datatang.com/damp/product/sample_presentation/20250116172535/0001_001_B-10.wav?Expires=4102415999&OSSAccessKeyId=LTAI5tEBeSWUJiqjXvBMsxEu&Signature=f83CovJuK5JqYXe0hD7czI0l%2FRw%3D"}]
211時間タイ語話者分離自然会話音声データセット
タイ語音声データセット
タイ語自然会話音声データ
タイ語話者分離音声データ
タイ語音声認識データセット
本データは、フルデュプレックス(全二重)対話を前提に収録した高品質なタイ語音声データセットです。有効時間211時間。半二重方式では再現が難しい同時発話や重なり発話、自然な相槌や割込みを含み、双方向に同時進行する対話を再現した同時双方向音声データセットとして、リアルタイム対話AIや次世代ASRの研究開発に適しています。そして、本セットは提示されたトピックリストから収録者が複数の得意分野を選択し、自然な流れで会話を展開して収録したタイ語自然会話音声データセットです。タイ各地のネイティブ話者による多様な対話を含み、高音質収録によりASRの音響・言語モデル学習、声紋識別、対話システム評価など幅広い研究用途に活用できます。データは各種プライバシー保護規制に準拠して管理されています。 当社の全二重音声データセットシリーズは、日本語をはじめ、英語、韓国語など多言語に対応し、書き起こしテキスト、発話タイムスタンプ、話者ID、性別などの詳細アノテーションを標準搭載しています。また、話者ごとの独立音声を含む話者分離音声データセットとしても利用可能で、収録条件や話者属性、ラベル仕様のカスタマイズ収集・作成にも柔軟に対応します。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
フォーマット
16kHz、16bit、非圧縮WAV、モノラル
コンテンツ分類
録音者による自由会話、自然で流暢な対話の収録
録音者情報
合計654名(男性183名、女性471名)
アノテーション項目
テキスト内容、発話タイムスタンプ、話者識別、性別
![サンプル]()
サンプル
Audio
คนหนีไปเติมต่าง นอกต่างประเทศมา มาเลถูกกว่าเท่าตัว
Audio
มึงขับแก๊สนั่นแก๊สหรือว่ารถน้ำมันรถไฟฟ้า
Audio
มึงต้องไปเติมมาเลเซียน้ำมันไม่แพง
Audio
Audio
ยังทำถนนยังไม่เสร็จอีกเหรอนี่
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

日本語の音声認識データにはどのようなバリエーションがありますか?

子どもの日常会話、モノローグ、講義、バラエティなど幅広いジャンルを含むリアルな対話音声が収録されており、話者 ID、性別、年齢、アクセントなどもアノテーションされています。

データの多様性は実際のユースケースに役立ちますか?

はい、リアルな対話と幅広い話者属性を収録しており、日本のさまざまな環境での音声認識モデルに対応可能です。

納品までのスピードはどの程度ですか?

既製データセットは最短1日で納品可能で、カスタム収集・アノテーションも迅速対応可能です。
adf502b9-f3ff-4c89-9f3e-f71dadb6bfc3