jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

3,506枚のヒンディー語OCRマークアップと転写データ

ヒンディー語
OCR
文書画像
インターネット画像
自然シーン
複数の角度
さまざまな光条件
四角形境界ボックスアノテーション
テキストの行レベルの転写
テキストの列レベルの転写

3,506枚のヒンディー語OCRマークアップおよび転写データには、自然シーン画像2,056枚、インターネット画像1,103枚、テキスト画像347枚が含まれている。マークアップの面では、行レベルの内容:行レベルの四角形ボックスマークアップ、行レベルの内容転写、縦列内容:縦列四角形ボックスのマークアップ、縦列内容の転写。このヒンディー語OCRマークアップと転写データは、マルチシーンでのヒンディー語認識、ヒンディー語写真翻訳などのタスクに使用することができます。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
データサイズ
自然シーンの写真2,056枚を含む3,506枚、インターネット画像テキスト1,103枚、テキスト画像347
収集環境
自然シーン(看板、包装説明書、小広告、メニュー、ポスターなど)、インターネット画像(雑誌表紙、漫画表紙など)、テキスト画像(テキストドキュメントなど)
収集多様性
複数のシーン、複数の角度、異なる照明条件を含む
収集装置
携帯電話
取得角度
見上げる、見上げる
データフォーマット
画像のフォーマットは.jpg、マークアップ文書のフォーマットは.json
マークアップ内容
行レベル四角形マークアップ、行レベル内容転写;縦列四角形のマークアップ、縦列内容の転写
精度
四角形枠の頂点偏差が10画素以下ですことは正しい検出であり、検出枠の精度は97%以上です。97%以上のテキスト転写精度
サンプル サンプル
  • 3,506枚のヒンディー語OCRマークアップと転写データ
  • 3,506枚のヒンディー語OCRマークアップと転写データ
  • 3,506枚のヒンディー語OCRマークアップと転写データ
おすすめデータセットおすすめデータセット
ご要望をご相談ください

プライバシー保護 に同意する

5a3e33d3-0a2c-4457-b15d-8203f87ac483

51286623-eafc-4caf-a7b1-92331bf9b0b2