Scandit AI Engineの仕組み
:format(jpeg))
要約:
- Scandit AIエンジンは、Scandit Smart Data Capture Platform全体でバーコードスキャン、ID検証、棚インテリジェンスを強化する中核となるAIエンジンです。
- 15年以上にわたる実際のエンタープライズ現場での経験に基づき、このエンジンは汎用的なタスクではなく、具体的で測定可能なビジネス課題を解決するために目的特化で設計されています。
- 最大99.9%の精度、オンデバイス処理、そして商用モバイル端末上でのリアルタイム性能は、中核となる譲れない(非交渉の)設計原則です。
- モデルはデフォルトでエンドユーザー端末上でローカル実行され、ライブの顧客データを学習に利用することなく、機密データを安全に保ちながら運用できます。
食料品店の店舗スタッフが、スマートデバイスにリアルタイムのアラートを受け取る場面を想像してください。
5番通路の人気商品が棚からなくなっている一方で、バックルームには同じ商品が5箱ある――そんな状況です。
スタッフはバックルームへ向かい、荷物で混み合った保管エリアをデバイスでスキャンします。するとAR(拡張現実)の表示が、目的の商品だけでなく、賞味期限が最も近い箱まで瞬時に特定します。
最適な商品を選んで、棚の補充は数分で完了。
迷いは不要、ムダな時間も発生せず、販売機会も取りこぼしません。
最大の利点は……ワンクリックで店舗全体の状況を“見える化”できることです。棚にある商品の在庫状況を日々把握できるというのは、どんな手作業のプロセスとも比べものになりません……。売上の向上は、商品が棚にきちんと並んでいる“欠品のない状態”の改善から生まれます。
これらすべてを支えているのがScandit AI Engineです。Scandit Smart Data Capture Platformの中核となるAIであり、当社のバーコードスキャン、IDスキャン、ShelfView製品を動かす知能そのものです。
複雑な作業を自動化し、リアルタイムのインサイトを提供することで、Scandit AI Engineは現場の従業員やお客様がより速く、より正確に意思決定できるようにします。言い換えれば、あらゆるスキャンの背後にある「脳」です。現実のビジネス現場で起こる複雑で変化の激しい状況をスムーズに扱い、次に取るべき行動を示しながら、組織全体の効率化を推進します。
Scandit AI Engineが特別な理由は?
ChatGPTのような汎用型の生成AIは注目を集めています。しかし、実運用での影響が大きいエンタープライズアプリケーションを構築する場合、本当の価値が生まれるのは、AIが棚割りの欠品改善のような、特定の測定可能なビジネス課題を解くために目的特化で作られているときです。
Scandit AI Engineが特別なのは、それを支える原則にあります。これらの原則は、世界最大級の企業向けに実際の現場課題を解決するソリューションを15年以上にわたって構築してきた経験から培われてきました。
- 精度は譲れない:この領域では99.9%の精度が重要です。IDが偽造である、棚のフェイシングが5つある、患者と投薬の組み合わせが正しい――といった判断において、誤りが許容される余地はほとんどありません。
- セキュリティとプライバシーを最優先:課題に応じて異なる方法でモデルを学習します。ただしScandit製品に共通するのは、デフォルトでライブの顧客データを学習に使わないことです。お客様には学習済みの最終モデルが提供され、これは数百万ピクセルの情報をミリ秒単位で解釈できます。多くの場合、モデルはエンドユーザー端末上でローカル実行され、機密データをあるべき場所に留めます。
- 商用モバイル端末でのリアルタイム性能に最適化:開始当初から、スピードが重要でバッテリーが貴重な現場スタッフの端末で、効率よく動作するように設計してきました。
- AIの狙いを絞った活用:AIは、特定のプロセスを大きく改善できるところに、意図的かつ的確に用います。Scandit AI Engineは、これまで多くの手作業を要していた非常に具体的(かつ手間のかかる)データ取得タスクを自動化し、企業にとって大きく、定量的に示せる価値を提供します。
- ユーザー中心のワークフロー:難しい条件下でも速く、安定して、身体的負担の少ないスキャンなど、現場の実課題に向き合います。最終目標は、開発者もユーザーも心配する必要がない「とにかくうまく動く」体験を提供することです。
世界最大級の小売企業の一社は、Scandit MatrixScan Pickを用いてトップストック(上部保管在庫)を確認することで、年間3,300万ドルのコスト削減を実現しています。
以下は、Scandit AI Engineが当社の3つの主要製品ラインをどのように支えているかの概要です。バーコードスキャン製品は、統一されたコードベースと共通の機械学習モデルを共有しています。一方、IDスキャンとShelfViewは技術的には別の製品ですが、同じチームが開発し、コンピュータビジョンにおける深い専門性を共有し、同じ原則に基づいて設計されています。
先進的なバーコードスキャン
Scanditは15年以上にわたり、スマートデバイスのカメラ映像からバーコードを読み取るために、機械学習(ML)とコンピュータビジョン(CV)を活用してきました。
Scandit創業当時、これは非常に難易度の高いエンジニアリング課題でした。現代的なAIはまだ黎明期で、初期のスマートフォンのカメラもオートフォーカスがなく、画質も十分ではありませんでした。
初期のころ、欧州最大級の食品小売企業のCIOから「この技術が実用レベルに達することはない」と言われたこともあります。現在では、米国の食品小売トップ10のうち8社、欧州の小売トップ10のうち5社にお客様としてご利用いただいています。
現場でこの領域に携わっていないと、コンピュータビジョンがどれほど難しいかは過小評価されがちです。人間は視覚に強く依存する生き物で、私たちが知る中で最も強力なスーパーコンピュータとも言える脳の、約半分が視覚処理に使われています。
人間にとって簡単なことが、コンピュータにとっては難しい。たとえば下の画像を見てください。人の目なら、ユーザーがスキャンしたいバーコードが、背景の棚に見えているバーコードではなく、手に持っている商品のバーコードだとすぐに判断できます。
しかし、2024年にScandit SDK 7がリリースされるまで、これを確実に実現できるソフトウェアは世界に存在しませんでした。
:format(jpeg))
この画像のバーコードを正確にスキャンするために、Scandit AI Engineは次のことを行う必要があります。
- 動きやバーコードの特徴などのコンテキスト情報を解析し、ユーザーがどのバーコードをスキャンしたいのかを特定する。
- 特定したバーコードを読み取る。このケースでは、バーコードが非常に小さく、曲面に印刷され、さらに反射(グレア)もあります。ほかにも、コードの破損、暗所、極端な角度、ブレた画像など、さまざまな条件に対応します。
こうした例外的なケースを個別にハードコードする必要はありません。AIを活用した当社のバーコードスキャンは、これらを自動で処理します。異なる環境にも適応し、開発者やエンドユーザーが明示的に指示しなくても、安定してコードを読み取れるようにします。
ScanditのAI主導のデータキャプチャ機能は、卓越した技術力を示すとともに、実環境の条件下でユーザーのスキャン体験を真に向上させるイノベーションに深く注力していることを証明しています。
そして、これは1つのコードをスキャンするだけの話です。MatrixScan製品では、上記のすべてを行いながら、Scandit AI Engineが複数のコードを同時並行でスキャンします。さらに各コードの位置を追跡し、拡張現実(AR)のオーバーレイを表示して、数える、見つける、ピッキングする といった特定のユースケースを解決します。しかも、バッテリーを無駄に消耗させません。
当社の最新のバーコードスキャン製品であるSmart Label Captureは、複数バーコードの読み取りにとどまらず、ラベル上の文字情報も取得できます。さらに重要なのは、ラベルの構造を理解できる点です。具体的には、バーコードの形式(例:15桁のIMEI番号)、各項目の配置、そして文脈的な関係(例:「BEST BEFORE」という表記の隣に日付がある)まで把握します。
その結果、アプリケーションには必要なデータだけが、過不足なく渡されます。
本人確認(IDスキャン/認証)
身分証明書(ID)は一筋縄ではいきません。国や地域によって形式が異なり、古いデザインも流通し続け、さらに不正者はレイアウトやエンコードの細かな違いまで巧妙に模倣します。そのため、現場チームにとって正確な本人確認は難しい作業になります。
IDスキャンと認証において、Scandit AI Engineは機械学習(ML)、コンピュータビジョン(CV)、ビジョン・ランゲージ・モデル(VLM)に加え、光学文字認識(OCR)などの技術も組み合わせ、非構造な視覚情報を、信頼できる検証可能な本人確認データ(構造化データ)へと変換します。
:format(jpeg))
ID確認におけるScandit AI Engineは、これとは異なる考え方で動作します。むしろ、偽造絵画の鑑定に近いアプローチです。偽造絵画は、描かれている「題材」そのものを見るのではなく、筆致や技法、素材などを調べ、それらが本物の作品として整合しているかどうかを評価して見抜かれます。
米国最大のフードデリバリー会社の一つは、スキャンディットを搭載した作業者アプリを使用して毎月200万件以上のIDを検証しています。
同様に、Scandit AIエンジンは単に個々のデータ値を取得してデコードするだけではありません。代わりに、データを正確に取得し、偽物を検出するために、フィールドがどのように保存されているか、バーコードがどのように生成および印刷されているか、視覚要素がどのように配置されているかなど、構造的な特性を分析します。
ShelfView(シェルフビュー)
当社の棚解析ソリューションであるShelfViewは、スマートデバイス、固定設置カメラ、ロボットなどで撮影した店舗棚の画像を解析する専門ソリューションです。LLMの学習と同様に、膨大なデータセットを取り込み、小売の棚を包括的かつ高精度に理解します。これにより小売事業者は、在庫システム上の数字ではなく、「棚に実際に何があるのか」を把握できます。
- シーン解析により、トレー、棚、商品、棚札を識別します。
- 画像認識で、商品をSKUレベルまで特定します。
- 棚札に対してOCRとバーコードスキャンを用い、商品情報や価格情報を抽出します。
これらを組み合わせることで、棚の正確なデジタル表現(一般に「リアログラム」と呼ばれます)を作成します。その後、店舗スタッフには欠品・誤陳列、価格や販促表示の誤りなどに関する優先度付きアラートが届き、顧客が気づく前に問題を解決できます。
:format(jpeg))
Scandit AI Engineの次なる進化は?
AIの未来は、業界固有のニーズに合わせて設計されたドメイン特化モデルにあります。最終的にScandit AI Engineが目指すのは、バーコードをスキャンする、IDをスキャンする、物体をスキャンする、テキストをスキャンする――といった区別がなくなる世界です。ただ「スキャンする」だけでいい。そんな体験へと進化していきます。
包括的なシーン解析は、複数のデータソースと周辺状況(コンテキスト)を取り込み、その場面に必要なデータとインサイトだけを正確に返します。消費者、店舗スタッフ、配送ドライバー、オペレーション管理者など、利用者や状況に合わせて、ツールを切り替えたり、何をしたいかを明示的に指示したりする必要がありません。
多くの点で、Scandit AI Engineは自動運転車に似ています。ただし、対象となる環境が「公道」ではなく、「あなたのビジネス」であるところが違います。
自動運転車は、カメラやセンサーで周囲を捉え、そのデータを高度な機械学習アルゴリズムで処理し、ブレーキや操舵を制御して安全に走行します。Scandit AI Engineは、スマートデバイスのカメラを使ってバーコード、テキスト、物体をリアルタイムに読み取り・解釈し、検知結果に基づいて即座にフィードバックやガイダンスを提供します。たとえば、価格の誤り、在庫不足、偽造IDの可能性などに関するアラートです。
どちらもAIは単に「見る」だけではありません。環境を理解し、状況に応じて反応することで、意思決定と業務効率を高めます。最終的にScandit AI Engineは、ビジネス環境とユーザーの間にあるインテリジェンス層として、デジタルとフィジカルの世界をつなぐ存在になります。
:format(jpeg))