発信者:Nexdata 日時: 2025-07-17
弊社は、800TBの画像系データセットを保有、これまでは、1万社以上のハイテク企業のAI開発にサポートしてきました。弊社のデータセットはお客様視点で更新されつつあります。今回は、顔認証、OCRなどに向けた最新のデータセットをご紹介いたします。
5万枚加工前後の顔画像データセット
東南アジア、東欧が中心で、黄人、黒人、白人を全般にカバーしています。データの種類は、肖像写真、家族集合写真、結婚写真などがあります。収集されたスタジオポートレートデータを細かくアノテーションし、PSキーイング、ポートレートセグメンテーションなどのタスクに利用できます。
15万人マルチ人種複数写真データセット
黄色人種、黒人、白人、褐色人種をカバーし、1人あたり最低5枚の写真を収録しています。複数の年齢層、複数のシーン、複数のポーズ、人の顔の表情をカバーしています。撮影された人物の文字ID、人種、国籍、性別、年齢層などをラベリングしています。ラベリング精度は95%以上になります。
1 万枚多国語掲示板の手書きOCRデータ
対象言語は英語、スペイン語、ポルトガル語、フランス語、日本語、イタリア語などです。 中でも英語が60%以上を占めています。収集環境は、黒板、ホワイトボード、グリーンボードを含みます。キャプチャーアングルは、平面、上面、上からのビューをカバーしています。手書きOCRタスクの取得精度は97%以上です。
1,417人 - 3Dリビングフェイス&なりすまし防止データ
収集シーンは屋内と屋外を含みます。データセットには男性と女性が含まれます。年齢分布は若年層から高齢者まで幅広く、若年層と中年層が大半を占めます。データの多様性は、様々な表情、顔の姿勢、なりすまし防止サンプル、複数の光条件、複数のシーンを含まれています。このデータは、3D顔認識、3Dリビングフェイス、なりすまし防止などのタスクに使用することができます。
ご興味がございましたら、お問い合わせください。