発信者:Nexdata 日時: 04/09/2026
弊社は、800TBの画像系データセットを保有、これまでは、1万社以上のハイテク企業のAI開発にサポートしてきました。弊社のデータセットはお客様視点で更新されつつあります。今回は、顔認証、OCRなどに向けた最新のデータセットをご紹介いたします。
5万枚加工前後の顔画像データセット
東南アジア、東欧が中心で、黄人、黒人、白人を全般にカバーしています。データの種類は、肖像写真、家族集合写真、結婚写真などがあります。収集されたスタジオポートレートデータを細かくアノテーションし、PSキーイング、ポートレートセグメンテーションなどのタスクに利用できます。
15万人マルチ人種複数写真データセット
黄色人種、黒人、白人、褐色人種をカバーし、1人あたり最低5枚の写真を収録しています。複数の年齢層、複数のシーン、複数のポーズ、人の顔の表情をカバーしています。撮影された人物の文字ID、人種、国籍、性別、年齢層などをラベリングしています。ラベリング精度は95%以上になります。
1 万枚多国語掲示板の手書きOCRデータ
対象言語は英語、スペイン語、ポルトガル語、フランス語、日本語、イタリア語などです。 中でも英語が60%以上を占めています。収集環境は、黒板、ホワイトボード、グリーンボードを含みます。キャプチャーアングルは、平面、上面、上からのビューをカバーしています。手書きOCRタスクの取得精度は97%以上です。
ご興味がございましたら、お問い合わせください。