[{"@type":"PropertyValue","name":"データ規模","value":"20,011枚の画像、20,011件の記述"},{"@type":"PropertyValue","name":"言語分布","value":"アジア言語: 韓国語、インドネシア語、マレー語、ベトナム語、タイ語、中国語、日本語 ヨーロッパ言語: フランス語、ドイツ語、イタリア語、ポルトガル語、ロシア語、スペイン語、英語"},{"@type":"PropertyValue","name":"収集環境","value":"店舗看板、バス停、ポスター、道路標識、リマインダーなどのシーンを含みます"},{"@type":"PropertyValue","name":"収集の多様性","value":"14の言語、複数の自然シーン、複数の撮影アングルが含まれています"},{"@type":"PropertyValue","name":"データフォーマット","value":"画像のフォーマットは.jpg、テキストのフォーマットは.txtです。"},{"@type":"PropertyValue","name":"収集設備","value":"スマホ、カメラ"},{"@type":"PropertyValue","name":"記述言語","value":"英語"},{"@type":"PropertyValue","name":"テキストの長さ","value":"原則として、30~60語、通常は3~5文で構成されます。"},{"@type":"PropertyValue","name":"主な記述内容","value":"テキスト配置、テキスト内容、色、シーン"},{"@type":"PropertyValue","name":"正確率","value":"97%以上の画像が正しくアノテーションされています。"}]
{"id":1288,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"226","type1str":null,"type2":"254","type2str":null,"dataname":"20,011枚の自然風景OCR記述データ","datazy":[{"title":"データ規模","desc":"データ規模","content":"20,011枚の画像、20,011件の記述"},{"title":"言語分布","desc":"言語分布","content":"アジア言語: 韓国語、インドネシア語、マレー語、ベトナム語、タイ語、中国語、日本語 ヨーロッパ言語: フランス語、ドイツ語、イタリア語、ポルトガル語、ロシア語、スペイン語、英語"},{"title":"収集環境","desc":"収集環境","content":"店舗看板、バス停、ポスター、道路標識、リマインダーなどのシーンを含みます"},{"title":"収集の多様性","desc":"収集の多様性","content":"14の言語、複数の自然シーン、複数の撮影アングルが含まれています"},{"title":"データフォーマット","desc":"データフォーマット","content":"画像のフォーマットは.jpg、テキストのフォーマットは.txtです。"},{"title":"収集設備","desc":"収集設備","content":"スマホ、カメラ"},{"title":"記述言語","desc":"記述言語","content":"英語"},{"title":"テキストの長さ","desc":"テキストの長さ","content":"原則として、30~60語、通常は3~5文で構成されます。"},{"title":"主な記述内容","desc":"主な記述内容","content":"テキスト配置、テキスト内容、色、シーン"},{"title":"正確率","desc":"正確率","content":"97%以上の画像が正しくアノテーションされています。"}],"datatag":"AIGC,English caption,OCR caption,Multiple shooting angles,Multinational scenes","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??10.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F10.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=MCVrBqb27YBjyCDI0Jnyl3bJBGA%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??6.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F6.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=YloKf4W4lvZRZqUksIOndlMhK5E%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??7.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F7.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=MaMzeRl2B1sFE7KT28iUKO33omo%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"アジア言語、ヨーロッパ言語を含む合計14言語、20,011枚の自然風景OCR記述データは、店舗看板、バス停、ポスター、道路標識など、さまざまな環境で複数の撮影角度で収集しました。記述言語は英語で、主にテキストの配置やテキストの内容、色などの情報を記述します。","dataexampl":null,"datakeyword":["AIGC","英語記述","OCR記述","多言語OCRデータ","多言語OCRデータ","OCRデータ","OCRデータセット"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"llm","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/??9.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F9.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VEHblArfRzk5e3PLr2jzicBVmRY%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F10.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=MCVrBqb27YBjyCDI0Jnyl3bJBGA%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F6.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=YloKf4W4lvZRZqUksIOndlMhK5E%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F7.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=MaMzeRl2B1sFE7KT28iUKO33omo%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY231231006_demo1727085603555/%3F%3F9.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VEHblArfRzk5e3PLr2jzicBVmRY%3D"}]
20,011枚の自然風景OCR記述データ
AIGC
英語記述
OCR記述
多言語OCRデータ
多言語OCRデータ
OCRデータ
OCRデータセット
アジア言語、ヨーロッパ言語を含む合計14言語、20,011枚の自然風景OCR記述データは、店舗看板、バス停、ポスター、道路標識など、さまざまな環境で複数の撮影角度で収集しました。記述言語は英語で、主にテキストの配置やテキストの内容、色などの情報を記述します。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データ規模
20,011枚の画像、20,011件の記述
言語分布
アジア言語: 韓国語、インドネシア語、マレー語、ベトナム語、タイ語、中国語、日本語 ヨーロッパ言語: フランス語、ドイツ語、イタリア語、ポルトガル語、ロシア語、スペイン語、英語
収集環境
店舗看板、バス停、ポスター、道路標識、リマインダーなどのシーンを含みます
収集の多様性
14の言語、複数の自然シーン、複数の撮影アングルが含まれています
データフォーマット
画像のフォーマットは.jpg、テキストのフォーマットは.txtです。
テキストの長さ
原則として、30~60語、通常は3~5文で構成されます。
主な記述内容
テキスト配置、テキスト内容、色、シーン
正確率
97%以上の画像が正しくアノテーションされています。
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
0f35904d-fd06-4644-859f-5bb01a81fb74