[{"@type":"PropertyValue","name":"データ規模","value":"14,980枚、8言語"},{"@type":"PropertyValue","name":"収集環境","value":"会議室(会場)、会議ホール"},{"@type":"PropertyValue","name":"言語種類","value":"フランス語、韓国語、日本語、スペイン語、ドイツ語、イタリア語、ポルトガル語、ロシア語"},{"@type":"PropertyValue","name":"収集の多様性","value":"多様なシーン、多様な言語、異なる撮影角度、異なる撮影距離、異なる照明条件"},{"@type":"PropertyValue","name":"収集設備","value":"スマートフォン"},{"@type":"PropertyValue","name":"収集角度","value":"正面、斜視(左、右)、仰視"},{"@type":"PropertyValue","name":"データフォーマット","value":"画像フォーマットは.jpg、アノテーションドキュメントフォーマットは.json"},{"@type":"PropertyValue","name":"アノテーション内容","value":"行単位の四角形アノテーション、行単位の四角形アノテーション"},{"@type":"PropertyValue","name":"正解率","value":"四角形ボックスの頂点偏差が5ピクセル以内を正しい検出とし、検出ボックス精度95%以上;テキストアノテーション精度95%以上"}]
{"id":979,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"14,980枚の8言語PPT OCRデータ","datazy":[{"title":"データ規模","desc":"データ規模","content":"14,980枚、8言語"},{"title":"収集環境","desc":"収集環境","content":"会議室(会場)、会議ホール"},{"title":"言語種類","desc":"言語種類","content":"フランス語、韓国語、日本語、スペイン語、ドイツ語、イタリア語、ポルトガル語、ロシア語"},{"title":"収集の多様性","desc":"収集の多様性","content":"多様なシーン、多様な言語、異なる撮影角度、異なる撮影距離、異なる照明条件"},{"title":"収集設備","desc":"収集設備","content":"スマートフォン"},{"title":"収集角度","desc":"収集角度","content":"正面、斜視(左、右)、仰視"},{"title":"データフォーマット","desc":"データフォーマット","content":"画像フォーマットは.jpg、アノテーションドキュメントフォーマットは.json"},{"title":"アノテーション内容","desc":"アノテーション内容","content":"行単位の四角形アノテーション、行単位の四角形アノテーション"},{"title":"正解率","desc":"正解率","content":"四角形ボックスの頂点偏差が5ピクセル以内を正しい検出とし、検出ボックス精度95%以上;テキストアノテーション精度95%以上"}],"datatag":"Multiple scenes,Multiple languages,Different photographic angles,Different photographic distances,Different light conditions","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/2.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/2.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=sqPdc1rGwcLu%2BK2TLOwTHcVrLQs%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/3.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/3.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=uOxRQ0dl8DcDwkjpEaXwlvSDyPg%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/1.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/1.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1jE3Q1rsa7koY0u0viSa%2FobOefo%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"14,980枚の8言語PPT OCRデータは8言語、多様なシーン、異なる撮影角度、異なる撮影距離、異なる照明条件を含む。アノテーションでは、行単位のテキスト四角形ボックス、行単位のテキストアノテーションをアノテーション。この多言語PPT OCRデータは多国語OCRタスクに利用可能。","dataexampl":null,"datakeyword":["PPT","OCR","会議室","会議ホール","異なる撮影角度","異なる撮影距離","異なる照明条件","行単位の四角形ボックスアノテーションとテキストアノテーション"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/5.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/5.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=kydEh0XnVloXhfsJGmIByO3Vi6U%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/2.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=sqPdc1rGwcLu%2BK2TLOwTHcVrLQs%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/3.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=uOxRQ0dl8DcDwkjpEaXwlvSDyPg%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/1.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1jE3Q1rsa7koY0u0viSa%2FobOefo%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY190221001_demo1695808941160/APY190221001_demo/5.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=kydEh0XnVloXhfsJGmIByO3Vi6U%3D"}]
14,980枚の8言語PPT OCRデータ
PPT
OCR
会議室
会議ホール
異なる撮影角度
異なる撮影距離
異なる照明条件
行単位の四角形ボックスアノテーションとテキストアノテーション
14,980枚の8言語PPT OCRデータは8言語、多様なシーン、異なる撮影角度、異なる撮影距離、異なる照明条件を含む。アノテーションでは、行単位のテキスト四角形ボックス、行単位のテキストアノテーションをアノテーション。この多言語PPT OCRデータは多国語OCRタスクに利用可能。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
言語種類
フランス語、韓国語、日本語、スペイン語、ドイツ語、イタリア語、ポルトガル語、ロシア語
収集の多様性
多様なシーン、多様な言語、異なる撮影角度、異なる撮影距離、異なる照明条件
データフォーマット
画像フォーマットは.jpg、アノテーションドキュメントフォーマットは.json
アノテーション内容
行単位の四角形アノテーション、行単位の四角形アノテーション
正解率
四角形ボックスの頂点偏差が5ピクセル以内を正しい検出とし、検出ボックス精度95%以上;テキストアノテーション精度95%以上
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
73696fad-bbe0-4a26-a900-48a3052ea4c1