「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

ホーム > 全てのデータセット > 音声合成データセット > 200,475件 TNデータセット（テキスト正規化）

200,475件 TNデータセット（テキスト正規化）

中国語音声合成向け正規化テキストデータ

中国語TTS向けTNデータセット

音声合成向けテキスト正規化データ

中国語テキスト読み正規化データ

本データセットには、合計200,475文の原文テキストが収録されています。各文について、特殊記号や数字に対する漢字での読み（正規化結果）を付与しており、テキスト正規化モデルの学習にそのまま利用できる構成となっています。

このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。

データ仕様

データ内容

200,475文のテキストを漢字表記に変換

データ規模

200,475文の元のテキスト、457,832件のアノテーション

データソース

さまざまな種類の小説、記事、ニュースから抽出された文

言語

中国語

アノテーション内容

文に含まれる特定の特殊記号やアラビア数字を漢字表記でアノテーション

応用シーン

TTS、テキスト正規化

サンプル

サンプル

おすすめデータセット

おすすめデータセット

319,977件中国語多音字コーパス

本データセットは、中国語の多音字における読音の曖昧性を解消することを目的としたコーパスです。603種類の字音を収録しており、各字音に対応する語彙数に応じて、収録されている例文（句数）は異なります。多音字の読音判別モデルや関連アプリケーションの学習に直接ご活用いただけます。

中国語音声合成向け多音字コーパス中国語多音字音声コーパス多音字読音判別モデル向け中国語コーパス

200,955件中国語テキスト韻律コーパス

本データセットは、ニュース文や口語文を含む20万件の中国語テキストに対して、4階層の韻律情報を付与したコーパスです。文長は適切にコントロールされ、文体・構文も多様になるよう厳選しています。TTSフロントエンドにおける韻律予測モデルの学習用データとして、そのままご利用いただける構成となっています。

中国語ニューステキストデータ中国語韻律付きテキストデータセット中国語口語文テキストデータ中国語韻律アノテーションテキストデータ

ご要望をご相談ください

プロジェクトの成熟度

初期検討段階（具体的な仕様は未定）

目標は明確だが、専門的な支援が必要

開発中または最適化フェーズ

データ／アノテーションの専門チーム（明確な仕様あり）

フルネーム *

電話番号*

会社名 *

ビジネスメール *

データ要件 *

プライバシー保護に同意する

よくあるご質問

音声データはどのような環境で収録されていますか？

すべての音声データは、Nexdata自社のプロ仕様録音スタジオで収録されており、音声合成（TTS）専門の言語学者・音響エンジニアが監修しています。ノイズフリーな環境と高精度マイクにより、クリアで自然な音声を実現しています。

多言語や方言にも対応していますか？

はい。英語、中国語、韓国語など主要言語のネイティブスピーカーに加え、関東・関西・九州など多数の日本語方言スピーカーも保有しています。お客様のターゲットに合わせて、最適なスピーカーを迅速に選定・編成でき、プロジェクトの立ち上げを大幅にスピードアップできます。

カスタム音声データの収録・アノテーションも可能ですか？

はい、可能です。専用録音設備、経験豊富なオペレーションチーム、TTS向けに最適化されたアノテーションツールを活用し、音素ラベル・プロソディ（韻律）・感情タグなど、お客様仕様の高精度アノテーションまでワンストップで提供します。ご要望に応じて、オリジナル音声データセットの構築も承ります。

ニュースレターを購読する

AI学習用データ製品: 全てのデータセット; LLMデータセット; 画像・動画データセット; 音声認識データセット; 音声合成データセット; OCRデータセット; 発音辞書データセット; 自然言語理解データセット

データサービス: 3D点群データ; ストリートビューデータ; OCRデータ; 行動識別データ; ID識別データ; 音声認識データ; 音声合成データ; マルチモーダルデータ

活用事例: エンボディドAI; 生成AI; 自動運転; 製造業; チャットボット; AR/VR; スマートホーム; リテール; ヘルスケア

企業情報: 運営会社; 資料ダウンロード; お役立ち情報; パートナー; データセキュリティ; イベント
リンク: OPENMPD; DataPlus; Datarade

プラットフォーム: プラットフォーム
コンテスト: コンテスト
リソース: オープンデータセット

より高品質なデータでより高精度なAIを構築

0362568911

[email protected]

nexdata_ai facebook

nexdata_ai twitter

nexdata_ai linkedin

nexdata_ai youtube

Copyright © 2023 NEXDATA TECHNOLOGY INC

サイドマップ利用規約

当社は、お客様のブラウジング体験を向上させ、パーソナライズされた広告やコンテンツを提供し、当社のトラフィックを分析するためにクッキーを使用します。「すべてを受け入れる」をクリックすると、クッキーの使用に同意したことになります。

63f72f41-a769-42d8-a325-4c25160aa013

58a8ce49-4f5b-4d33-853a-876ad622d5b7