「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

200,955件中国語テキスト韻律コーパス

中国語ニューステキストデータ
中国語韻律付きテキストデータセット
中国語口語文テキストデータ
中国語韻律アノテーションテキストデータ

本データセットは、ニュース文や口語文を含む20万件の中国語テキストに対して、4階層の韻律情報を付与したコーパスです。文長は適切にコントロールされ、文体・構文も多様になるよう厳選しています。TTSフロントエンドにおける韻律予測モデルの学習用データとして、そのままご利用いただける構成となっています。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
データ内容
200,955件の韻律情報付きテキスト
データサイズ
200,955件
データリソース
ニュースや日常のチャットからのテキストで、ニュースクラスと口語文
アノテーション特徴
4階層の韻律情報を付与したコーパス
言語
中国語
-
-
-
-
サンプル サンプル
  • 200,955件中国語テキスト韻律コーパス
おすすめデータセットおすすめデータセット
ご要望をご相談ください

プライバシー保護 に同意する

よくあるご質問

音声データはどのような環境で収録されていますか?

すべての音声データは、Nexdata自社のプロ仕様録音スタジオで収録されており、音声合成(TTS)専門の言語学者・音響エンジニアが監修しています。ノイズフリーな環境と高精度マイクにより、クリアで自然な音声を実現しています。

多言語や方言にも対応していますか?

はい。英語、中国語、韓国語など主要言語のネイティブスピーカーに加え、関東・関西・九州など多数の日本語方言スピーカーも保有しています。お客様のターゲットに合わせて、最適なスピーカーを迅速に選定・編成でき、プロジェクトの立ち上げを大幅にスピードアップできます。

カスタム音声データの収録・アノテーションも可能ですか?

はい、可能です。専用録音設備、経験豊富なオペレーションチーム、TTS向けに最適化されたアノテーションツールを活用し、音素ラベル・プロソディ(韻律)・感情タグなど、お客様仕様の高精度アノテーションまでワンストップで提供します。ご要望に応じて、オリジナル音声データセットの構築も承ります。

4c2e0caa-7e52-499c-b0b6-31269cd68796

ff7140f7-de88-4f85-9b41-37cfb83d9eff