「Datatang株式会社」は現在「Nexdata」のブランドとして事業を展開しています。本サイトより最新のAIデータサービスとソリューションをご案内いたします。

jp

Please fill in your name

Mobile phone format error

Please enter the telephone

Please enter your company name

Please enter your company email

Please enter the data requirement

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

The data requirement cannot be less than 5 words and cannot be pure numbers

m.nexdata.datatang.com

71,535件 英語自然シーンOCRデータ

英語
自然シーン
OCR
複数シーン
複数撮影アングル
複数光条件
行レベル・単語レベル・文字レベル境界ボックス
テキスト書き起こし

71,535枚の英語自然シーンのOCRデータ収集が英国と米国のフィールドで収集されたものです。 複数のシーン、複数の撮影アングル、複数の照明条件で収集されたものでデータの多様性を持っています。アノテーションに関しては、英語OCRデータは、行レベル&単語レベル&文字レベルの矩形ボックス(または四角形ボックス)でアノテーションされ、テキスト内容を書き起こします。 この英語自然シーンOCRデータセットは、英語自然シーンのOCRタスクに利用できます

有料データセット
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
仕様データ仕様
アノテーション特徴
71,535枚の画像。1枚の画像に一つのアノテーション文書を付きます
収集環境
イギリスとアメリカの現地で収集された内容です。中には店舗用プレート、ポスター、道路標識、注意喚起、警告、説明書、メニュー、建物標識など
収集多様性
複数のシーン、複数の撮影アングル、複数の照明条件を含みます
収集設備
スマートフォン、カメラ、タブレット端末
撮影角度
見上げ、見下ろし、平らに
データフォーマット
画像データのフォーマットが.jpgでアノテーションテキスト文書のフォーマットが.jsonです
アノテーション内容
行レベル、単語レベル、文字レベルの四辺形ボックスのアノテーションと内容書き起こし
サンプル サンプル
  • 71,535件 英語自然シーンOCRデータ
  • 71,535件 英語自然シーンOCRデータ
  • 71,535件 英語自然シーンOCRデータ
おすすめデータセットおすすめデータセット
ご要望をご相談ください

プライバシー保護 に同意する

よくあるご質問

日本語OCRデータは、どのような形式・内容で提供されていますか?

手書き文字、帳票、商品ラベル、看板、公共文書など、実際の業務・生活シーンを想定した多様なデータを提供しています。すべてのデータセットには、行レベル・文字レベルのバウンディングボックスとテキスト転写が含まれ、用途に応じて柔軟にご利用いただけます。各データには詳細な仕様書とサンプルも同梱しており、事前にデータの特徴や適用可能性をご確認いただけます。

英語・日本語など多言語混在の帳票データも収集できますか?

はい、可能です。日本、アメリカ、中国、韓国など主要国を含むグローバルパートナー網を活用し、お客様の指定する業種・地域・フォーマットの実在帳票を現地で収集します。収集と並行して、ネイティブスピーカーによる高精度なアノテーションを即時実施できる体制を整えており、多言語混在文書や業界特化フォーマットにも柔軟に対応します。

多言語や業界特化データにも対応していますか?

はい。日本語(標準語・方言含む)に加え、英語、中国語、韓国語など12言語以上の自然シーンOCRデータを提供しています。製造、物流、小売、金融、公共サービスなど業界別のデータ構成も可能で、お客様のユースケースに最適なデータセットを迅速にご提案・提供いたします。

3441d7a0-f435-4ca8-9857-c628db34bf19

58c4dc63-3563-4050-b2ab-45c54735b24b