[{"@type":"PropertyValue","name":"データ規模","value":"韓国語 76,861 枚、555,913 フレーム; ヒンディー語 27,459 枚、200,453 フレーム"},{"@type":"PropertyValue","name":"収集環境","value":"商品パッケージ、ポスター、チケット、リマインダー、メニュー、建物の看板など。"},{"@type":"PropertyValue","name":"収集の多様性","value":"多様な自然シーン、多様な撮影角度、異なる照明条件"},{"@type":"PropertyValue","name":"収集設備","value":"スマートフォン"},{"@type":"PropertyValue","name":"撮影角度","value":"仰視点、俯瞰視点、水平視点"},{"@type":"PropertyValue","name":"言語分布","value":"韓国語、ヒンディー語、英語(少量)"},{"@type":"PropertyValue","name":"データフォーマット","value":"画像形式:.jpg、アノテーションドキュメント形式:.json"},{"@type":"PropertyValue","name":"アノテーションボックスの形状分布","value":"韓国語:315,822個の四角形ボックス、240,091個の多角形ボックス。ヒンディー語:780個の四角形ボックス、199,671個の多角形ボックス、2個の矩形ボックス。"},{"@type":"PropertyValue","name":"アノテーション特徴","value":"行単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーション、行単位の内容転写、テキスト属性(言語種類)。列単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーション、列単位の内容転写、テキスト属性(言語種類)。"},{"@type":"PropertyValue","name":"正解率","value":"アノテーションボックスの頂点の偏差が5ピクセルを超えない場合を正しい検出とみなす。検出ボックスの精度は95%以上。文字おこしの精度は95%以上。"}]
{"id":1254,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"104,320枚の韓国語とヒンディー語の自然シーンOCRデータ","datazy":[{"title":"データ規模","desc":"データ規模","content":"韓国語 76,861 枚、555,913 フレーム; ヒンディー語 27,459 枚、200,453 フレーム"},{"title":"収集環境","desc":"収集環境","content":"商品パッケージ、ポスター、チケット、リマインダー、メニュー、建物の看板など。"},{"title":"収集の多様性","desc":"収集の多様性","content":"多様な自然シーン、多様な撮影角度、異なる照明条件"},{"title":"収集設備","desc":"収集設備","content":"スマートフォン"},{"title":"撮影角度","desc":"撮影角度","content":"仰視点、俯瞰視点、水平視点"},{"title":"言語分布","desc":"言語分布","content":"韓国語、ヒンディー語、英語(少量)"},{"title":"データフォーマット","desc":"データフォーマット","content":"画像形式:.jpg、アノテーションドキュメント形式:.json"},{"title":"アノテーションボックスの形状分布","desc":"アノテーションボックスの形状分布","content":"韓国語:315,822個の四角形ボックス、240,091個の多角形ボックス。ヒンディー語:780個の四角形ボックス、199,671個の多角形ボックス、2個の矩形ボックス。"},{"title":"アノテーション特徴","desc":"アノテーション特徴","content":"行単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーション、行単位の内容転写、テキスト属性(言語種類)。列単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーション、列単位の内容転写、テキスト属性(言語種類)。"},{"title":"正解率","desc":"正解率","content":"アノテーションボックスの頂点の偏差が5ピクセルを超えない場合を正しい検出とみなす。検出ボックスの精度は95%以上。文字おこしの精度は95%以上。"}],"datatag":"Multiple natural scenes,Multiple shooting angles,Multiple light conditions","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/2.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/2.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1xXx3CKukYZpXUoWeGQa3UM5%2F5A%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/3.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/3.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=k36XqpwImWbppq62S04QPeMPSEA%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/1.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/1.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=zyhyQSDYy6jTbpF3nc4f%2F09ufT4%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"104,320枚の韓国語とヒンディー語の自然シーンOCRデータは、商品パッケージ、ポスター、チケット、案内表示、メニュー、建物の標識などのシーンから収集されています。データの多様性には、多様なシーン、多様な撮影角度、多様な照明条件が含まれます。言語分布は韓国語、ヒンディー語、および英語(少量)です。アノテーションに関しては、行単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーション、行単位の内容転写、テキスト属性(言語種類)を行い、列単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーショ、列単位の内容転写、テキスト属性(言語種類)を行います。この韓国語とヒンディー語の自然シーンOCRデータは、韓国語とヒンディー語の自然シーンにおけるOCRタスクに活用できます。","dataexampl":null,"datakeyword":["韓国語","ヒンディー語","OCRデータ","自然シーン","OCR音訳データ"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/5.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/5.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=59499xW%2FRbwxe18fQPgO5cjSQFE%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/2.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1xXx3CKukYZpXUoWeGQa3UM5%2F5A%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/3.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=k36XqpwImWbppq62S04QPeMPSEA%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/1.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=zyhyQSDYy6jTbpF3nc4f%2F09ufT4%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY230328002_demo1711533626489/APY230328002_demo/5.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=59499xW%2FRbwxe18fQPgO5cjSQFE%3D"}]
104,320枚の韓国語とヒンディー語の自然シーンOCRデータ
韓国語
ヒンディー語
OCRデータ
自然シーン
OCR音訳データ
104,320枚の韓国語とヒンディー語の自然シーンOCRデータは、商品パッケージ、ポスター、チケット、案内表示、メニュー、建物の標識などのシーンから収集されています。データの多様性には、多様なシーン、多様な撮影角度、多様な照明条件が含まれます。言語分布は韓国語、ヒンディー語、および英語(少量)です。アノテーションに関しては、行単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーション、行単位の内容転写、テキスト属性(言語種類)を行い、列単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーショ、列単位の内容転写、テキスト属性(言語種類)を行います。この韓国語とヒンディー語の自然シーンOCRデータは、韓国語とヒンディー語の自然シーンにおけるOCRタスクに活用できます。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データ規模
韓国語 76,861 枚、555,913 フレーム; ヒンディー語 27,459 枚、200,453 フレーム
収集環境
商品パッケージ、ポスター、チケット、リマインダー、メニュー、建物の看板など。
収集の多様性
多様な自然シーン、多様な撮影角度、異なる照明条件
データフォーマット
画像形式:.jpg、アノテーションドキュメント形式:.json
アノテーションボックスの形状分布
韓国語:315,822個の四角形ボックス、240,091個の多角形ボックス。ヒンディー語:780個の四角形ボックス、199,671個の多角形ボックス、2個の矩形ボックス。
アノテーション特徴
行単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーション、行単位の内容転写、テキスト属性(言語種類)。列単位の多角形ボックス(または四角形ボックス、矩形ボックス)アノテーション、列単位の内容転写、テキスト属性(言語種類)。
正解率
アノテーションボックスの頂点の偏差が5ピクセルを超えない場合を正しい検出とみなす。検出ボックスの精度は95%以上。文字おこしの精度は95%以上。
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
f159d262-2ffa-4a73-937f-18e8c6d0b0dc