jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

104,320枚の韓国語とヒンディー語の自然シーンOCRデータ

韓国語
ヒンディー語
OCRデータ
自然シーン
OCR音訳データ

104,320枚の韓国語とヒンディー語の自然シーンOCRデータは、商品パッケージ、ポスター、チケット、案内表示、メニュー、建物の標識などのシーンから収集されています。データの多様性には、多様なシーン、多様な撮影角度、多様な照明条件が含まれます。言語分布は韓国語、ヒンディー語、および英語(少量)です。アノテーションに関しては、行単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーション、行単位の内容転写、テキスト属性(言語種類)を行い、列単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーショ、列単位の内容転写、テキスト属性(言語種類)を行います。この韓国語とヒンディー語の自然シーンOCRデータは、韓国語とヒンディー語の自然シーンにおけるOCRタスクに活用できます。

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
データ規模
韓国語 76,861 枚、555,913 フレーム; ヒンディー語 27,459 枚、200,453 フレーム
収集環境
商品パッケージ、ポスター、チケット、リマインダー、メニュー、建物の看板など。
収集の多様性
多様な自然シーン、多様な撮影角度、異なる照明条件
収集設備
スマートフォン
撮影角度
仰視点、俯瞰視点、水平視点
言語分布
韓国語、ヒンディー語、英語(少量)
データフォーマット
画像形式:.jpg、アノテーションドキュメント形式:.json
アノテーションボックスの形状分布
韓国語:315,822個の四角形ボックス、240,091個の多角形ボックス。ヒンディー語:780個の四角形ボックス、199,671個の多角形ボックス、2個の矩形ボックス。
アノテーション特徴
行単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーション、行単位の内容転写、テキスト属性(言語種類)。列単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーション、列単位の内容転写、テキスト属性(言語種類)。
正解率
アノテーションボックスの頂点の偏差が5ピクセルを超えない場合を正しい検出とみなす。検出ボックスの精度は95%以上。文字おこしの精度は95%以上。
サンプル サンプル
  • 104,320枚の韓国語とヒンディー語の自然シーンOCRデータ
  • 104,320枚の韓国語とヒンディー語の自然シーンOCRデータ
  • 104,320枚の韓国語とヒンディー語の自然シーンOCRデータ
おすすめデータセットおすすめデータセット
ご要望をご相談ください

プライバシー保護 に同意する

da5eada6-bdce-4511-be74-31358bb2eaa7

f159d262-2ffa-4a73-937f-18e8c6d0b0dc