[{"@type":"PropertyValue","name":"データ規模","value":"全6,087枚、合計385,107の矩形ボックス"},{"@type":"PropertyValue","name":"収集の多様性","value":"さまざまな種類の健康診断レポート"},{"@type":"PropertyValue","name":"データフォーマット","value":"画像:.jpg、アノテーションドキュメント:.json"},{"@type":"PropertyValue","name":"アノテーション内容","value":"行単位の矩形ボックスアノテーション、行単位の内容のテキスト転写"},{"@type":"PropertyValue","name":"正解率","value":"・矩形ボックスのずれが±3ピクセル以内で合格、検出ボックス合格率97%以上\n・テキスト転写精度97%以上"}]
{"id":1257,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"6,087枚健康診断レポートOCRデータセット","datazy":[{"title":"データ規模","desc":"データ規模","content":"全6,087枚、合計385,107の矩形ボックス"},{"title":"収集の多様性","desc":"収集の多様性","content":"さまざまな種類の健康診断レポート"},{"title":"データフォーマット","desc":"データフォーマット","content":"画像:.jpg、アノテーションドキュメント:.json"},{"title":"アノテーション内容","desc":"アノテーション内容","content":"行単位の矩形ボックスアノテーション、行単位の内容のテキスト転写"},{"title":"正解率","desc":"正解率","content":"・矩形ボックスのずれが±3ピクセル以内で合格、検出ボックス合格率97%以上\n・テキスト転写精度97%以上"}],"datatag":"OCR,Multiple types of physical examination report","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230406001_demo1715076001134/APY230406001_demo/17.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230406001_demo1715076001134/APY230406001_demo/17.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=QTihJgg5YlL8s0kfJj9hlBw4wVE%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230406001_demo1715076001134/APY230406001_demo/6.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230406001_demo1715076001134/APY230406001_demo/6.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=6G0A%2BF4rUuvSKq%2BYWN3hdRewZKo%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230406001_demo1715076001134/APY230406001_demo/21.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230406001_demo1715076001134/APY230406001_demo/21.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=nOuIR5j74btKgqpOrUsgi4sHuaY%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"6,087枚体検レポートを集めたOCRデータセットは、行単位の矩形ボックスアノテーションと行単位のテキスト転写が付与されています。健康診断レポートの認識・検出タスクなどに活用可能です。","dataexampl":null,"datakeyword":["健康診断レポート","OCRデータ","OCRデータセット","OCRアノテーション","OCR収集","OCRデータ処理","OCR転写データ"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE\"},{\"code\":\"3\",\"language\":\"EN\"},{\"code\":\"4\",\"language\":\"JP\"}]","productNameEn":"6,087 Images Physical Examination Report OCR Data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230406001_demo1715076001134/APY230406001_demo/3.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230406001_demo1715076001134/APY230406001_demo/3.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=CCHjL5VGso4uVggZAwB1Zc6cLr4%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230406001_demo1715076001134/APY230406001_demo/17.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=QTihJgg5YlL8s0kfJj9hlBw4wVE%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230406001_demo1715076001134/APY230406001_demo/6.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=6G0A%2BF4rUuvSKq%2BYWN3hdRewZKo%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230406001_demo1715076001134/APY230406001_demo/21.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=nOuIR5j74btKgqpOrUsgi4sHuaY%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230406001_demo1715076001134/APY230406001_demo/3.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=CCHjL5VGso4uVggZAwB1Zc6cLr4%3D"}]
6,087枚健康診断レポートOCRデータセット
健康診断レポート
OCRデータ
OCRデータセット
OCRアノテーション
OCR収集
OCRデータ処理
OCR転写データ
6,087枚体検レポートを集めたOCRデータセットは、行単位の矩形ボックスアノテーションと行単位のテキスト転写が付与されています。健康診断レポートの認識・検出タスクなどに活用可能です。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データ規模
全6,087枚、合計385,107の矩形ボックス
データフォーマット
画像:.jpg、アノテーションドキュメント:.json
アノテーション内容
行単位の矩形ボックスアノテーション、行単位の内容のテキスト転写
正解率
・矩形ボックスのずれが±3ピクセル以内で合格、検出ボックス合格率97%以上
・テキスト転写精度97%以上
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

日本語OCRデータは、どのような形式・内容で提供されていますか?

手書き文字、帳票、商品ラベル、看板、公共文書など、実際の業務・生活シーンを想定した多様なデータを提供しています。すべてのデータセットには、行レベル・文字レベルのバウンディングボックスとテキスト転写が含まれ、用途に応じて柔軟にご利用いただけます。各データには詳細な仕様書とサンプルも同梱しており、事前にデータの特徴や適用可能性をご確認いただけます。

英語・日本語など多言語混在の帳票データも収集できますか?

はい、可能です。日本、アメリカ、中国、韓国など主要国を含むグローバルパートナー網を活用し、お客様の指定する業種・地域・フォーマットの実在帳票を現地で収集します。収集と並行して、ネイティブスピーカーによる高精度なアノテーションを即時実施できる体制を整えており、多言語混在文書や業界特化フォーマットにも柔軟に対応します。

多言語や業界特化データにも対応していますか?

はい。日本語(標準語・方言含む)に加え、英語、中国語、韓国語など12言語以上の自然シーンOCRデータを提供しています。製造、物流、小売、金融、公共サービスなど業界別のデータ構成も可能で、お客様のユースケースに最適なデータセットを迅速にご提案・提供いたします。
2c39663a-1517-4540-ab99-45873af50286