[{"@type":"PropertyValue","name":"データサイズ","value":"自然シーンの写真2,056枚を含む3,506枚、インターネット画像テキスト1,103枚、テキスト画像347"},{"@type":"PropertyValue","name":"収集環境","value":"自然シーン(看板、包装説明書、小広告、メニュー、ポスターなど)、インターネット画像(雑誌表紙、漫画表紙など)、テキスト画像(テキストドキュメントなど)"},{"@type":"PropertyValue","name":"収集多様性","value":"複数のシーン、複数の角度、異なる照明条件を含む"},{"@type":"PropertyValue","name":"収集装置","value":"携帯電話"},{"@type":"PropertyValue","name":"取得角度","value":"見上げる、見上げる"},{"@type":"PropertyValue","name":"データフォーマット","value":"画像のフォーマットは.jpg、マークアップ文書のフォーマットは.json"},{"@type":"PropertyValue","name":"マークアップ内容","value":"行レベル四角形マークアップ、行レベル内容転写;縦列四角形のマークアップ、縦列内容の転写"},{"@type":"PropertyValue","name":"精度","value":"四角形枠の頂点偏差が10画素以下ですことは正しい検出であり、検出枠の精度は97%以上です。97%以上のテキスト転写精度"}]
{"id":1058,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp","type1":"147","type1str":null,"type2":"150","type2str":null,"dataname":"3,506枚のヒンディー語OCRマークアップと転写データ","datazy":[{"title":"データサイズ","desc":"データサイズ","content":"自然シーンの写真2,056枚を含む3,506枚、インターネット画像テキスト1,103枚、テキスト画像347"},{"title":"収集環境","desc":"収集環境","content":"自然シーン(看板、包装説明書、小広告、メニュー、ポスターなど)、インターネット画像(雑誌表紙、漫画表紙など)、テキスト画像(テキストドキュメントなど)"},{"title":"収集多様性","desc":"収集多様性","content":"複数のシーン、複数の角度、異なる照明条件を含む"},{"title":"収集装置","desc":"収集装置","content":"携帯電話"},{"title":"取得角度","desc":"取得角度","content":"見上げる、見上げる"},{"title":"データフォーマット","desc":"データフォーマット","content":"画像のフォーマットは.jpg、マークアップ文書のフォーマットは.json"},{"title":"マークアップ内容","desc":"マークアップ内容","content":"行レベル四角形マークアップ、行レベル内容転写;縦列四角形のマークアップ、縦列内容の転写"},{"title":"精度","desc":"精度","content":"四角形枠の頂点偏差が10画素以下ですことは正しい検出であり、検出枠の精度は97%以上です。97%以上のテキスト転写精度"}],"datatag":"Hindi OCR,Multiple scenes,Multiple angles,Different light conditions","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00004.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00004.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1RHyBQ877xadK9qW66Lj6Ivikq0%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00006.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00006.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ZYCVjKlMLMjdYWQ17c9BpniCAa0%3D","intro":"","size":0,"progress":100,"type":"jpg"},{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00027.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00027.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=p8LQVuz%2BoHuw%2BP8mwBwq45M3q9Q%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"3,506枚のヒンディー語OCRマークアップおよび転写データには、自然シーン画像2,056枚、インターネット画像1,103枚、テキスト画像347枚が含まれている。マークアップの面では、行レベルの内容:行レベルの四角形ボックスマークアップ、行レベルの内容転写、縦列内容:縦列四角形ボックスのマークアップ、縦列内容の転写。このヒンディー語OCRマークアップと転写データは、マルチシーンでのヒンディー語認識、ヒンディー語写真翻訳などのタスクに使用することができます。","dataexampl":null,"datakeyword":["ヒンディー語","OCR","文書画像","インターネット画像","自然シーン","複数の角度","さまざまな光条件","四角形境界ボックスアノテーション","テキストの行レベルの転写","テキストの列レベルの転写"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Data Type,Language","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"ocr","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"],"firstList":[{"name":"/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00001.jpg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00001.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VNNczsPK38IDN%2F2BxuBFYMdpzBc%3D","intro":"","size":0,"progress":100,"type":"jpg"}]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_tuxiang_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00004.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=1RHyBQ877xadK9qW66Lj6Ivikq0%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00006.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=ZYCVjKlMLMjdYWQ17c9BpniCAa0%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00027.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=p8LQVuz%2BoHuw%2BP8mwBwq45M3q9Q%3D"},{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200102001_demo1695808983232/APY200102001_demo/00001.jpg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=VNNczsPK38IDN%2F2BxuBFYMdpzBc%3D"}]
3,506枚のヒンディー語OCRマークアップと転写データ
ヒンディー語
OCR
文書画像
インターネット画像
自然シーン
複数の角度
さまざまな光条件
四角形境界ボックスアノテーション
テキストの行レベルの転写
テキストの列レベルの転写
3,506枚のヒンディー語OCRマークアップおよび転写データには、自然シーン画像2,056枚、インターネット画像1,103枚、テキスト画像347枚が含まれている。マークアップの面では、行レベルの内容:行レベルの四角形ボックスマークアップ、行レベルの内容転写、縦列内容:縦列四角形ボックスのマークアップ、縦列内容の転写。このヒンディー語OCRマークアップと転写データは、マルチシーンでのヒンディー語認識、ヒンディー語写真翻訳などのタスクに使用することができます。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
データサイズ
自然シーンの写真2,056枚を含む3,506枚、インターネット画像テキスト1,103枚、テキスト画像347
収集環境
自然シーン(看板、包装説明書、小広告、メニュー、ポスターなど)、インターネット画像(雑誌表紙、漫画表紙など)、テキスト画像(テキストドキュメントなど)
収集多様性
複数のシーン、複数の角度、異なる照明条件を含む
データフォーマット
画像のフォーマットは.jpg、マークアップ文書のフォーマットは.json
マークアップ内容
行レベル四角形マークアップ、行レベル内容転写;縦列四角形のマークアップ、縦列内容の転写
精度
四角形枠の頂点偏差が10画素以下ですことは正しい検出であり、検出枠の精度は97%以上です。97%以上のテキスト転写精度
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
51286623-eafc-4caf-a7b1-92331bf9b0b2