jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

OCRデータセット

既製の高品質データセットでAIモデルのパフォーマンスを即座に向上させます。

データタイプ

全て
26
自然シーン
9
手書き文字
14
インターネット画像
3
帳票
1
その他
4
試験内容
2
1

言語

全て
26
中国語
7
英語
4
ヒンディー語
2
日本語
5
韓国語
5
その他
17
ベトナム語
2

14,980枚の8言語PPT OCRデータ

14,980枚の8言語PPT OCRデータは8言語、多様なシーン、異なる撮影角度、異なる撮影距離、異なる照明条件を含む。アノテーションでは、行単位のテキスト四角形ボックス、行単位のテキストアノテーションをアノテーション。この多言語PPT OCRデータは多国語OCRタスクに利用可能。
PPT OCR 会議室 会議ホール 異なる撮影角度 異なる撮影距離 異なる照明条件 行単位の四角形ボックスアノテーションとテキストアノテーション

101人4,538枚の日本語手書きOCRデータ

101人4,538枚の日本語手書きOCRデータテキストキャリアはA4用紙です。このデータの内容は社会民生、娯楽、観光、スポーツイベント、映画、作曲などの分野をカバーしています。マーキングの面では、テキストに対して文字レベルの矩形枠マーキング、文字レベルのコンテンツ転写、および行レベルの矩形枠マーキング、行レベルのコンテンツ転写を行う。このセットのデータは、日本語手書きOCRタスクに使用できます。
日本語の筆跡 ocr 文字レベルの長方形の境界箱アノテーション テキストの転写 書道 落書き 原稿 日本語のocrデータ

5,147件の日本語手書きOCRデータ

5,147件の日本語手書きOCRデータの文字媒体はA4用紙、罫線紙、グラフ用紙などです。収集設備は携帯電話であり、収集アングルは水平視点です。データ内容は、日本語作文、詩、散文、ニュース、物語などの分野を網羅しています。アノテーションに関しては、行レベルのテキストを四角形のボックスでマークし、行レベルのテキストを転写します。このデータセットは、日本語の手書き OCR タスクに使用できます。
日本語 手書き OCR ラインレベルアノテーション ラインレベル文字おこし

100人日韓手書きデータ

100人の日韓手書きデータは、データ入力者合計100人のうち、日本人50人、韓国人49人とアフガニスタン人1人。各人が書いたコーパスはすべて異なります。本データの網羅性やバリエーションは、様々な携帯録音設備と異なるコーパスを含みます。本日韓手書きデータセットは、日本語と韓国語の手書き文字OCR認識に活用可能。
日本語 韓国語 手書きOCR 手書き軌跡

105,941枚の12言語自然シーンOCRデータセット

105,941枚の12言語自然シーンOCRデータは、12種類の言語(アジア言語6種類、ヨーロッパ言語6種類)をカバーし、多様な自然シーンや撮影角度で収集されています。アノテーションについては、行単位のテキストの四角形バウンディングボックスと、行単位のテキスト文字起こしが行われています。このデータセットは、多言語OCRタスクに活用できます。
日本語 韓国語 インドネシア語 マレー語 ベトナム語 タイ語 フランス語 ドイツ語 イタリア語 ポルトガル語 ロシア語 スペイン語 OCR 自然な会話シーン 多様な撮影アングル テキストの行レベルの四角形バウンディングボックスアノテーションとテキスト転写

497枚の英文請求書データ

本データは、無地の背景で収集され、個人情報は匿名処理が施されています。多種多様なカテゴリの領収書が含まれており、領収書認識や文字認識などのタスクに利用できます。
OCR 請求書アノテーション 複数の種類の請求書

71,535件 英語自然シーンOCRデータ

71,535枚の英語自然シーンのOCRデータ収集が英国と米国のフィールドで収集されたものです。 複数のシーン、複数の撮影アングル、複数の照明条件で収集されたものでデータの多様性を持っています。アノテーションに関しては、英語OCRデータは、行レベル&単語レベル&文字レベルの矩形ボックス(または四角形ボックス)でアノテーションされ、テキスト内容を書き起こします。 この英語自然シーンOCRデータセットは、英語自然シーンのOCRタスクに利用できます
英語 自然シーン OCR 複数シーン 複数撮影アングル 複数光条件 行レベル・単語レベル・文字レベル境界ボックス テキスト書き起こし

573,264枚のテスト用紙&練習帳&解答用紙収集データ

573,264枚のテスト用紙&練習帳&解答用紙収集データ。データには35,823枚のテスト用紙、457,970枚の練習帳、79,471枚の解答用紙が含まれます。データは多種の問題形式、多種の科目、多種のタイプ、複数の学年をカバーします。収集デバイスはスマートフォン、スキャナーです。データは自動採点、宿題指導などのタスクに使用できます。データ保護法規とプライバシー規定を厳格に遵守し、データ収集、保存、使用の過程でユーザーのプライバシーと法的権利を保護します。すべてのデータはGDPR、CCPA、PIPLに準拠しています。
テスト用紙&練習帳&解答用紙 小学校 中学校 全科目 多種の問題形式 多種の科目 多種のタイプ 複数の学年 自動採点 宿題指導 収集データ テスト用紙データ 解答用紙データ

5,156枚の数学式手書きOCRデータ

5,156枚の数学式手書きOCRデータ。記入環境はA4紙、方眼紙、横線紙、ホワイトボードなどです。収集の多様性は多種の記入用紙、多種の数学式、多種の収集角度を含みます。収集角度は平視と仰視です。このデータセットは数学式手書きOCRタスクに使用できます。
数学式 手書き OCR A4用紙 方眼紙 横線紙 ホワイトボード A4用紙 方眼紙 横線紙 ホワイトボード 仰角 平視角

loading

今すぐデータをカスタマイズ

既製データセットの強み

  • 著作権あり

    著作権あり

    自社版権で すぐ納品可能
  • 安全

    安全

    承認済み 安全で使用可能
  • 専門性高い

    専門性高い

    AIデータの専門家により 設計・作成
  • 多様性に富む

    多様性に富む

    様々な 実際のシーンから収集
  • コスパ高い

    コスパ高い

    カスタマイズより コスパが優れている
  • 効率的

    効率的

    即座に 納品可能
f17232bf-5358-4b0a-a06a-0e43be829262