[{"@type":"PropertyValue","name":"データ規模","value":"5,147枚"},{"@type":"PropertyValue","name":"収集環境","value":"普通のA4用紙、罫線紙、グラフ用紙など"},{"@type":"PropertyValue","name":"収集設備","value":"スマホ"},{"@type":"PropertyValue","name":"収集アングル","value":"水平視"},{"@type":"PropertyValue","name":"データフォーマット","value":"画像データのフォーマットは.jpg、アノテーション文書のフォーマットは.jsonです。"},{"@type":"PropertyValue","name":"データコンテンツ","value":"日本語作文、詩、散文、ニュース、物語など"},{"@type":"PropertyValue","name":"コンテンツアノテーション","value":"行レベルの四角形アノテーション、行レベルのコンテンツ転写"},{"@type":"PropertyValue","name":"正確率","value":"収集されたコンテンツの精度は97%以上、テキスト転写の精度は97%以上です。"}]
{"id":1296,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"5,147件の日本語手書きOCRデータ","datazy":[{"title":"データ規模","desc":"データ規模","content":"5,147枚"},{"title":"収集環境","desc":"収集環境","content":"普通のA4用紙、罫線紙、グラフ用紙など"},{"title":"収集設備","desc":"収集設備","content":"スマホ"},{"title":"収集アングル","desc":"収集アングル","content":"水平視"},{"title":"データフォーマット","desc":"データフォーマット","content":"画像データのフォーマットは.jpg、アノテーション文書のフォーマットは.jsonです。"},{"title":"データコンテンツ","desc":"データコンテンツ","content":"日本語作文、詩、散文、ニュース、物語など"},{"title":"コンテンツアノテーション","desc":"コンテンツアノテーション","content":"行レベルの四角形アノテーション、行レベルのコンテンツ転写"},{"title":"正確率","desc":"正確率","content":"収集されたコンテンツの精度は97%以上、テキスト転写の精度は97%以上です。"}],"datatag":"Japanese,Handwriting,OCR","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/009_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/009_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=IKrYjX6PdLsxHsbAqkmNmTO39n4%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/008_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/008_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=Vz%2FLsZ0CIUeMO8zehveUjgHEPj8%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/004_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/004_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=kXZw0nftSaz%2BsTcpMG0ZFUxOGmA%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"5,147件の日本語手書きOCRデータの文字媒体はA4用紙、罫線紙、グラフ用紙などです。収集設備は携帯電話であり、収集アングルは水平視点です。データ内容は、日本語作文、詩、散文、ニュース、物語などの分野を網羅しています。アノテーションに関しては、行レベルのテキストを四角形のボックスでマークし、行レベルのテキストを転写します。このデータセットは、日本語の手書き OCR タスクに使用できます。","dataexampl":null,"datakeyword":["日本語","手書き","OCR","ラインレベルアノテーション","ラインレベル文字おこし"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/007_demo.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/007_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VTAB8%2BYD%2FxjIud0F52OXs3w3B%2Fo%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/009_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=IKrYjX6PdLsxHsbAqkmNmTO39n4%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/008_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=Vz%2FLsZ0CIUeMO8zehveUjgHEPj8%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/004_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=kXZw0nftSaz%2BsTcpMG0ZFUxOGmA%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230930001_demo1730800805647/APY230930001_demo/007_demo.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VTAB8%2BYD%2FxjIud0F52OXs3w3B%2Fo%3D"}]
5,147件の日本語手書きOCRデータ
日本語
手書き
OCR
ラインレベルアノテーション
ラインレベル文字おこし
5,147件の日本語手書きOCRデータの文字媒体はA4用紙、罫線紙、グラフ用紙などです。収集設備は携帯電話であり、収集アングルは水平視点です。データ内容は、日本語作文、詩、散文、ニュース、物語などの分野を網羅しています。アノテーションに関しては、行レベルのテキストを四角形のボックスでマークし、行レベルのテキストを転写します。このデータセットは、日本語の手書き OCR タスクに使用できます。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データフォーマット
画像データのフォーマットは.jpg、アノテーション文書のフォーマットは.jsonです。
データコンテンツ
日本語作文、詩、散文、ニュース、物語など
コンテンツアノテーション
行レベルの四角形アノテーション、行レベルのコンテンツ転写
正確率
収集されたコンテンツの精度は97%以上、テキスト転写の精度は97%以上です。
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
9f90d953-e517-4660-be5e-f241e6d7b206