[{"@type":"PropertyValue","name":"データ規模","value":"5,147枚"},{"@type":"PropertyValue","name":"収集環境","value":"普通のA4用紙、罫線紙、グラフ用紙など"},{"@type":"PropertyValue","name":"収集設備","value":"スマホ"},{"@type":"PropertyValue","name":"収集アングル","value":"水平視"},{"@type":"PropertyValue","name":"データフォーマット","value":"画像データのフォーマットは.jpg、アノテーション文書のフォーマットは.jsonです。"},{"@type":"PropertyValue","name":"データコンテンツ","value":"日本語作文、詩、散文、ニュース、物語など"},{"@type":"PropertyValue","name":"コンテンツアノテーション","value":"行レベルの四角形アノテーション、行レベルのコンテンツ転写"},{"@type":"PropertyValue","name":"正確率","value":"収集されたコンテンツの精度は97%以上、テキスト転写の精度は97%以上です。"}]
{"id":1296,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"5,147件日本語手書きOCRデータセット","datazy":[{"title":"データ規模","desc":"データ規模","content":"5,147枚"},{"title":"収集環境","desc":"収集環境","content":"普通のA4用紙、罫線紙、グラフ用紙など"},{"title":"収集設備","desc":"収集設備","content":"スマホ"},{"title":"収集アングル","desc":"収集アングル","content":"水平視"},{"title":"データフォーマット","desc":"データフォーマット","content":"画像データのフォーマットは.jpg、アノテーション文書のフォーマットは.jsonです。"},{"title":"データコンテンツ","desc":"データコンテンツ","content":"日本語作文、詩、散文、ニュース、物語など"},{"title":"コンテンツアノテーション","desc":"コンテンツアノテーション","content":"行レベルの四角形アノテーション、行レベルのコンテンツ転写"},{"title":"正確率","desc":"正確率","content":"収集されたコンテンツの精度は97%以上、テキスト転写の精度は97%以上です。"}],"datatag":"Japanese,Handwriting,OCR","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/009_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/009_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=IKrYjX6PdLsxHsbAqkmNmTO39n4%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/008_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/008_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=Vz%2FLsZ0CIUeMO8zehveUjgHEPj8%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/004_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/004_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=kXZw0nftSaz%2BsTcpMG0ZFUxOGmA%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"日本語手書き文字の自動認識や文書デジタル化の開発では、日本人の自然な筆跡を反映した高精度な教師データの確保が課題です。弊社が提供する本データセットは、日本人548名から収集された5,147枚の手書き画像です。性別は男性244名・女性304名。年齢層は18〜45歳が中心(494名)。実用的な筆跡バリエーションを網羅します。収録環境はA4用紙・罫線入り用紙・方眼用紙など。スマートフォンで撮影。視線レベルのアングルで統一。データ形式は画像が.jpg、注釈が.json。収録コンテンツは多岐にわたります。作文・詩・散文・ニュース・物語など、実用的な日本語テキストを幅広くカバー。日常の手書き表現を自然に反映しています。アノテーションは高精度です。行レベルの四角形バウンディングボックス+テキスト転写を付与。収集精度・文字転写精度ともに97%超を確保。学習用として最適な品質を実現。本データセットは、日本語手書き文字認識モデルの学習や、筆跡理解・文書デジタル化アルゴリズム開発に最適。日本人筆跡特化の日本語OCR教師データ、手書きノート自動変換、フォーム入力自動化、教育・出版分野のデジタルアーカイブなど、幅広い用途にご利用いただけます。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録コンテンツ・アノテーション粒度・データ形式などを柔軟に調整。独自性の高い日本語手書きOCRソリューション開発を、最適な学習データ基盤でサポートいたします。","dataexampl":null,"datakeyword":["日本語手書きOCRデータセット","日本語手書き文字教師データ","OCRデータセット","日本語OCR教師データ"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","dataShowType":"[{\"code\":\"0\",\"language\":\"ZH\"},{\"code\":\"1\",\"language\":\"ZH\"},{\"code\":\"2\",\"language\":\"EN,JP,PT,DE,KO,FR,ES\"},{\"code\":\"3\",\"language\":\"EN\"}]","productNameEn":"5,147 Images Japanese Handwriting OCR data","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/007_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/007_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VTAB8%2BYD%2FxjIud0F52OXs3w3B%2Fo%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/009_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=IKrYjX6PdLsxHsbAqkmNmTO39n4%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/008_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=Vz%2FLsZ0CIUeMO8zehveUjgHEPj8%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/004_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=kXZw0nftSaz%2BsTcpMG0ZFUxOGmA%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/007_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VTAB8%2BYD%2FxjIud0F52OXs3w3B%2Fo%3D"}]
5,147件日本語手書きOCRデータセット
日本語手書きOCRデータセット
日本語手書き文字教師データ
OCRデータセット
日本語OCR教師データ
日本語手書き文字の自動認識や文書デジタル化の開発では、日本人の自然な筆跡を反映した高精度な教師データの確保が課題です。弊社が提供する本データセットは、日本人548名から収集された5,147枚の手書き画像です。性別は男性244名・女性304名。年齢層は18〜45歳が中心(494名)。実用的な筆跡バリエーションを網羅します。収録環境はA4用紙・罫線入り用紙・方眼用紙など。スマートフォンで撮影。視線レベルのアングルで統一。データ形式は画像が.jpg、注釈が.json。収録コンテンツは多岐にわたります。作文・詩・散文・ニュース・物語など、実用的な日本語テキストを幅広くカバー。日常の手書き表現を自然に反映しています。アノテーションは高精度です。行レベルの四角形バウンディングボックス+テキスト転写を付与。収集精度・文字転写精度ともに97%超を確保。学習用として最適な品質を実現。本データセットは、日本語手書き文字認識モデルの学習や、筆跡理解・文書デジタル化アルゴリズム開発に最適。日本人筆跡特化の日本語OCR教師データ、手書きノート自動変換、フォーム入力自動化、教育・出版分野のデジタルアーカイブなど、幅広い用途にご利用いただけます。さらに、お客様の開発要件に合わせてカスタマイズ対応も可能。収録コンテンツ・アノテーション粒度・データ形式などを柔軟に調整。独自性の高い日本語手書きOCRソリューション開発を、最適な学習データ基盤でサポートいたします。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データフォーマット
画像データのフォーマットは.jpg、アノテーション文書のフォーマットは.jsonです。
データコンテンツ
日本語作文、詩、散文、ニュース、物語など
コンテンツアノテーション
行レベルの四角形アノテーション、行レベルのコンテンツ転写
正確率
収集されたコンテンツの精度は97%以上、テキスト転写の精度は97%以上です。
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
よくあるご質問

日本語OCRデータは、どのような形式・内容で提供されていますか?

手書き文字、帳票、商品ラベル、看板、公共文書など、実際の業務・生活シーンを想定した多様なデータを提供しています。すべてのデータセットには、行レベル・文字レベルのバウンディングボックスとテキスト転写が含まれ、用途に応じて柔軟にご利用いただけます。各データには詳細な仕様書とサンプルも同梱しており、事前にデータの特徴や適用可能性をご確認いただけます。

英語・日本語など多言語混在の帳票データも収集できますか?

はい、可能です。日本、アメリカ、中国、韓国など主要国を含むグローバルパートナー網を活用し、お客様の指定する業種・地域・フォーマットの実在帳票を現地で収集します。収集と並行して、ネイティブスピーカーによる高精度なアノテーションを即時実施できる体制を整えており、多言語混在文書や業界特化フォーマットにも柔軟に対応します。

多言語や業界特化データにも対応していますか?

はい。日本語(標準語・方言含む)に加え、英語、中国語、韓国語など12言語以上の自然シーンOCRデータを提供しています。製造、物流、小売、金融、公共サービスなど業界別のデータ構成も可能で、お客様のユースケースに最適なデータセットを迅速にご提案・提供いたします。
2e48cdb4-52ee-410a-abbe-45bd375541bb