この度は自動運転EXPO弊社ブースへご来場いただき、誠にありがとうございました。展示会で多くの方からご質問をいただいた8つの高品質データセットについて、改めて特徴を整理してご紹介いたします。
【ノイズモデリング向け】531時間 車内ノイズデータセット
車載音声システム開発に不可欠なリアルノイズデータ。10種類の異なる車種で、4台のマイク+2台のスマホを6か所に配置し同期収録。
- 晴天317時間+雨天214時間の天候バリエーション
- 5次元の条件組み合わせ:天候/前後窓開閉状態/エアコン強度/道路種別(駐車・市街地・環状線・高速)
- マイク:32kHz/32bit、スマホ:16kHz/16bitの高解像度収録
- 各音声に道路種・天候・エアコン状態などの詳細メタデータ付与
【ノイズモデリング向け】101時間 多様シーン環境ノイズデータセット
車外・公共空間のノイズを網羅した汎用データセット。レコーダーで10種類の実環境を収録。
- スーパー28.3時間、道路21.6時間、地下鉄17.4時間、空港15時間など10シーンをカバー
- 44.1kHz/16bit/ステレオの高音質収録
- 車載音声アシスタントの屋外使用時ノイズ対策に最適
- 実環境の複雑な音響特性(人の声・機械音・反響)を忠実に再現
【ノイズモデリング向け】19時間 バス車内ノイズデータセット
公共交通機関特有のノイズ環境を捉えた専門データセット。高解像度収録。
- 車内12.5時間+バス停7.1時間の2シチュエーション
- 48kHz/24bit/ステレオのハイレゾ音源
- 車内での端末設置位置をランダム化し、実使用に近い状況を再現
- 公共交通向け音声インターフェース開発に特化
【声紋認証向け】521名中国語話者 スマートフォン音声データセット
声紋認証モデルのトレーニングに最適な音声データセットです。521名の話者(男性33%、女性67%)がスマートフォン(Android/iPhone)で収録した約119時間の音声を提供します。特徴は以下の通りです。
- 静かな屋内環境で反響なしの高品質収録(16kHz/16bit/モノラルWAV)
- 各話者が2週間以上の間隔をあけて4回収録し、時間的変動を考慮
- 数字・ウェイクワード・汎用カテゴリ・ニュース・スマートホームコマンドなど多様な発話内容
- 中国全7大方言地域をカバーし、年齢層も16〜60歳まで幅広く分布
- 転写精度98%以上を保証
【運転者モニタリング向け】28,972枚 運転者顔検出・96ランドマークアノテーションデータセット
ADASやドライバーモニタリングシステム向けの高精度顔アノテーションデータです。100名の被験者から収録した28,972枚の画像に、顔検出バウンディングボックスと96個の顔ランドマークを精密にアノテーションしています。
- 赤外線カメラ(640×480)による昼夜問わずの安定収録
- 50名男性・50名女性、白人50名・黒人30名・ブラウン系20名の多様な人種構成
- 危険運転・疲労運転・視線移動など実運転シナリオを網羅
- 車内3か所(ルームミラー中央・センターコンソール上・Aピラー上)から同時収録
- ランドマーク精度95%以上、遮蔽・姿勢変化にも対応した3D予測アノテーション
【車内安全向け】16,270動画 乗客物品遺失行動データセット
忘れ物検知AIの開発に不可欠な実環境データセットです。5,780件の物品遺失、4,230件のペット遺失、6,260件の子供遺失の計16,270動画を収録しています。
- 可視光・赤外線の両モードで1080P以上で収録
- 車内環境を忠実に再現した実験的収録
- 子供(6ヶ月〜3歳)・ペット(犬・猫など)・物品(スマホ・財布など15種類)を網羅
- 昼夜の照明条件、車種(セダン・SUV)の違いを考慮
- アノテーション精度95%以上を達成
【運転行動分析向け】304名多民族 運転者行動収録データセット
多様な人種・年齢層を対象とした運転行動認識データセットです。304名(白人90名・黒人194名・インド系20名)の被験者が、3台のカメラで50種類の運転行動を収録しています。
- RGBと赤外線のバイノキュラーカメラ(640×480/20fps)で昼夜対応
- 危険行動(携帯使用・シートベルト未着用など)・疲労行動(まばたき・あくびなど)・視線移動を網羅
- 各被験者につき150動画(3カメラ×50行動)を収録
- 18〜60歳の幅広い年齢層、男女比192:112でバランス良好
- 収録精度・アノテーション精度ともに95%以上
【乗客ケア向け】122名 乗客行動認識データセット
子供や高齢者を含む乗客の安全・快適性向上に向けたデータセットです。122名の被験者が4台のカメラで30種類の乗客行動を収録しています。
- 通常行動(通話・読書・飲食など)と異常行動(乗り物酔い・眠気・物品遺失)を包括
- 車内4か所(ルームミラー・Aピラー・Bピラー左右)から多角的視点で収録
- 乗り物酔い(軽度・中度)・眠気(軽度・重度)の段階的表現を実現
- 各被験者につき120動画(4カメラ×30行動)を収録
- 多民族(白人30名・黒人87名・インド系5名)で文化的多様性を担保
サンプルデータのダウンロード
各データセットのサンプルをご覧になりたい場合は、下記よりお問い合わせいただけます。
お問い合わせ - Nexdata
ご質問やカスタムデータ収録のご要望がございましたら、お気軽にお問い合わせください。今後ともNexdataをよろしくお願いいたします。