[{"@type":"PropertyValue","name":"データ内容","value":"多音字の曖昧さ解消のために作成されたコーパス"},{"@type":"PropertyValue","name":"データサイズ","value":"603文字の発音、319,977文のコーパスを含む"},{"@type":"PropertyValue","name":"テキストソース","value":"ニュースクラスと口語化文が含まれています"},{"@type":"PropertyValue","name":"寸法メソッド","value":"文に含まれる特定の多音字の読みを表記する"},{"@type":"PropertyValue","name":"言語","value":"中国語"},{"@type":"PropertyValue","name":"-","value":"-"},{"@type":"PropertyValue","name":"-","value":"-"}]
{"id":1036,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp","type1":"165","type1str":null,"type2":"219","type2str":null,"dataname":"319,977件中国語多音字コーパス","datazy":[{"title":"データ内容","desc":"データ内容","content":"多音字の曖昧さ解消のために作成されたコーパス"},{"title":"データサイズ","desc":"データサイズ","content":"603文字の発音、319,977文のコーパスを含む"},{"title":"テキストソース","desc":"テキストソース","content":"ニュースクラスと口語化文が含まれています"},{"title":"寸法メソッド","desc":"寸法メソッド","content":"文に含まれる特定の多音字の読みを表記する"},{"title":"言語","desc":"言語","content":"中国語"},{"title":"-","desc":"-","content":"-"},{"title":"-","desc":"-","content":"-"}],"datatag":"Mandarin,Polyphone,TTS,Front-end Training Data Set","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY190921001_demo1712743222701/APY190921001_demo/5C6AE796-AF30-46AC-ABCC-B698830A2626.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190921001_demo1712743222701/APY190921001_demo/5C6AE796-AF30-46AC-ABCC-B698830A2626.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=3DU9vnyc7%2BB9S6WWDgNefaHBCqc%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"本データセットは、中国語の多音字における読音の曖昧性を解消することを目的としたコーパスです。603種類の字音を収録しており、各字音に対応する語彙数に応じて、収録されている例文(句数)は異なります。多音字の読音判別モデルや関連アプリケーションの学習に直接ご活用いただけます。","dataexampl":null,"datakeyword":["中国語音声合成向け多音字コーパス","中国語多音字音声コーパス","多音字読音判別モデル向け中国語コーパス"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Language,Voice Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"speechSyn","BGimg":"brightSpot_audio","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_yuyin_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190921001_demo1712743222701/APY190921001_demo/5C6AE796-AF30-46AC-ABCC-B698830A2626.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=3DU9vnyc7%2BB9S6WWDgNefaHBCqc%3D"}]
319,977件中国語多音字コーパス
中国語音声合成向け多音字コーパス
中国語多音字音声コーパス
多音字読音判別モデル向け中国語コーパス
本データセットは、中国語の多音字における読音の曖昧性を解消することを目的としたコーパスです。603種類の字音を収録しており、各字音に対応する語彙数に応じて、収録されている例文(句数)は異なります。多音字の読音判別モデルや関連アプリケーションの学習に直接ご活用いただけます。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データ内容
多音字の曖昧さ解消のために作成されたコーパス
データサイズ
603文字の発音、319,977文のコーパスを含む
テキストソース
ニュースクラスと口語化文が含まれています
寸法メソッド
文に含まれる特定の多音字の読みを表記する
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

音声データはどのような環境で収録されていますか?

すべての音声データは、Nexdata自社のプロ仕様録音スタジオで収録されており、音声合成(TTS)専門の言語学者・音響エンジニアが監修しています。ノイズフリーな環境と高精度マイクにより、クリアで自然な音声を実現しています。

多言語や方言にも対応していますか?

はい。英語、中国語、韓国語など主要言語のネイティブスピーカーに加え、関東・関西・九州など多数の日本語方言スピーカーも保有しています。お客様のターゲットに合わせて、最適なスピーカーを迅速に選定・編成でき、プロジェクトの立ち上げを大幅にスピードアップできます。

カスタム音声データの収録・アノテーションも可能ですか?

はい、可能です。専用録音設備、経験豊富なオペレーションチーム、TTS向けに最適化されたアノテーションツールを活用し、音素ラベル・プロソディ(韻律)・感情タグなど、お客様仕様の高精度アノテーションまでワンストップで提供します。ご要望に応じて、オリジナル音声データセットの構築も承ります。
d7de66c7-41aa-46af-b0fd-3a501b230494