自動運転が本格的に街中を走り出す今、ただ「たくさんデータがある」だけじゃもう通用しません。特に自動駐車や狭い路地での走行といったシーンでは、LiDARが捉えた点群一つひとつに正確な意味づけ——つまり「セマンティックセグメンテーション」——が肝心です。そんな中、Nexdataはとあるトップクラスの自動運転アルゴリズム企業向けに、28万フレームを超える高品質アノテーションデータセットを納品しています。そのフレーム単位の合格率は業界でも認められる98%以上に達しています。
今回のケーススタディでは、その取り組みとNexdataのコアコンピテンシーをご紹介します。
課題だらけの始まり:高いハードル・曖昧なルール
厳しい品質要件
クライアントはフレーム単位の合格率98%以上を要求。初期段階では10%サンプリング検査方式を採用していたため、基準が極めて厳格かつ検査カバレッジが不十分であり、開始は一度も合格するバッチがなく、納期へのプレッシャーが非常に高まりました。
多様かつ複雑なシーン構成
データには地下駐車場、屋外パーキング、狭隘路走行など、静的・動的要素が複雑に絡み合う多様なシナリオが含まれています。点群密度が高く、遮蔽が頻発し、物体境界が曖昧であるため、アノテーターの判断力とツール支援機能に対する要求水準が極めて高くなりました。
仕様の変更
試作段階から量産フェーズにかけて、アノテーション仕様は度々更新され、すべての修正作業は最新版仕様に従って実施する必要がありました。従って、ラベルの一貫性維持とデータバージョンのトレーサビリティ確保が大きな課題となりました。
技術・プロセス・信頼:三つの柱で乗り越えた高難度プロジェクト
本案件は、従来のアノテーション手法では達成が極めて困難でした。単なる人的投入や時間延長では、98%という品質要件と納期の両立は不可能だったのです。
地下駐車場では、汎用モデルが床や壁を誤って染色し、7割以上を手修正せざるを得ない状況でした。そこで、実データでカスタムモデルを再学習。さらに「地面より下はノイズ」「天井高は2.5m未満」といった物理ルールを組み込みました。結果、ラベル付与効率は50%以上向上。ノイズ識別精度も92%に達し、1フレームあたり1.8分の工数削減を実現しています。
狭隘路でも同様です。路肩やフェンスといった静的オブジェクトは、従来モデルではほとんど検出できませんでした。当社モデルはF1スコア86%を達成し、再作業を4割以上削減。チームは焦らず、安定したペースで納品を続けられました。
業界で一般的な点群のダウンサンプリングは、敢えて採用しませんでした。一見効率的ですが、アルゴリズムの学習に悪影響を及ぼすリスクがあるためです。代わりに、非ダウンサンプリングで連続フレームを重畳アノテーション。同一クリップ内の全フレームを1タスクとして管理することで、フレーム間の不整合を完全に排除。Pose情報による無効データの100%除外も行い、クライアント様が「使えないデータ」に悩む余地を一切残しませんでした。
しかし、真の転機は技術ではなく、対話にありました。
初期検収で不合格となった直後、当社はデータ分析を持参し、クライアント様と協議の場を設けました。「10%抽检では、たまたま不良フレームが選ばれた可能性があります」——この提案を受け、専任検収員7名が投入され、フルインスペクション体制へ移行されました。合格率は99.2%へ急上昇。以降、すべてのバッチが初回で通過しています。
仕様変更への対応も、単なる受諾にとどまりません。「この変更により、○日遅延します」「コストは△円増加します」と影響を明示した上で、アルゴリズム側の代替策まで提案。その結果、工期・費用ともにトラブルはゼロ。クライアント様からは、「最も安心できるパートナー」と評価いただきました。
これは、外注先と発注者の関係を超え、共に課題を解き、成果を創り出す協働の証です。
数字以上の価値:信頼が次の案件を呼んだ
最終的に、合格率は最高99.7%、平均でも98.5%を3か月連続でキープしていました。生産性は22%アップで、納期も5日早く終えました。このプロジェクトで培ったノウハウをまとめた『点群セグメンテーション実施ガイド』や『プリアノテーション最適化ハンドブック』が、今や社内の標準資料になっています。
大事なのは“一緒に走る姿勢”
このプロジェクトを通じて感じたのは——データの質は、技術力だけじゃなくて、どれだけ相手の課題に寄り添えるかで決まるということ。私たちは、単なる外注先ではなく、LiDARや4Dミリ波レーダーの特性を理解し、BEVFormerやPointPillarsといったモデルの学習ロジックに合わせたラベル設計ができるパートナーです。何より、現場で得た教訓を即座にモデルやツールに反映し続けている——人物セグメンテーション、ナンバープレートOCR、小さな障害物の検出……すでに5種類の汎用ソリューションが生まれています。
自動運転の認識モデル、キャビン内のジェスチャー認識、あるいはロボットの環境理解といったAIプロジェクトを進めているなら——一度、データの“信頼性” について、ゆっくり話してみませんか?
Nexdataでは、以下の3つを無料でご提供しています:
貴社のシナリオに本当に合うか?の適合性評価
チーム・予算・スケジュールに合わせたアノテーション設計
最初の100フレームで品質を実際に検証
お気軽にご相談ください:
https://jp.nexdata.ai/contactus