「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

319,977件中国語多音字コーパス

中国語音声合成向け多音字コーパス
中国語多音字音声コーパス
多音字読音判別モデル向け中国語コーパス

本データセットは、中国語の多音字における読音の曖昧性を解消することを目的としたコーパスです。603種類の字音を収録しており、各字音に対応する語彙数に応じて、収録されている例文(句数)は異なります。多音字の読音判別モデルや関連アプリケーションの学習に直接ご活用いただけます。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
データ内容
多音字の曖昧さ解消のために作成されたコーパス
データサイズ
603文字の発音、319,977文のコーパスを含む
テキストソース
ニュースクラスと口語化文が含まれています
寸法メソッド
文に含まれる特定の多音字の読みを表記する
言語
中国語
-
-
-
-
サンプル サンプル
  • 319,977件中国語多音字コーパス
おすすめデータセットおすすめデータセット
ご要望をご相談ください

プライバシー保護 に同意する

よくあるご質問

音声データはどのような環境で収録されていますか?

すべての音声データは、Nexdata自社のプロ仕様録音スタジオで収録されており、音声合成(TTS)専門の言語学者・音響エンジニアが監修しています。ノイズフリーな環境と高精度マイクにより、クリアで自然な音声を実現しています。

多言語や方言にも対応していますか?

はい。英語、中国語、韓国語など主要言語のネイティブスピーカーに加え、関東・関西・九州など多数の日本語方言スピーカーも保有しています。お客様のターゲットに合わせて、最適なスピーカーを迅速に選定・編成でき、プロジェクトの立ち上げを大幅にスピードアップできます。

カスタム音声データの収録・アノテーションも可能ですか?

はい、可能です。専用録音設備、経験豊富なオペレーションチーム、TTS向けに最適化されたアノテーションツールを活用し、音素ラベル・プロソディ(韻律)・感情タグなど、お客様仕様の高精度アノテーションまでワンストップで提供します。ご要望に応じて、オリジナル音声データセットの構築も承ります。

65d5c4ef-045e-4851-a304-a32a0202bd73

d7de66c7-41aa-46af-b0fd-3a501b230494