マスクはAIによる属性判定モデルを破壊するのか

AI /

デジタルサイネージにAIカメラを搭載し、覗き込んだ人、なんとなく視線が合った人などの、年齢、性別のセグメント、いわゆるマーケティング属性を判断し、最適なコンテンツに切り替える。これによってかつてのコンテンツ流しっぱなしよりは効果がより高くなるだろう。こんな取り組みは次々と行われているし、手前味噌だがビズライト・テクノロジーはこの仕組みを埼玉高速鉄道の車両に導入し、世界初の自律型DOOHシステムを2020年4月から開始した。

もちろん、デジタルサイネージじゃなくたっていい。店舗の入り口にカメラがあって、同じような判断をして、従来は誰(どんな属性の人という意味)が来ているのかわからなかった店舗にも、マーケティング的にこういったデータを提供できれば、店舗にとってみれば新たな気付きが得られるのだ。現実にそういったリクエストをもらっている。

しかしここで問題が起きた。コロナ禍で100%に近い人がマスクを装着する世の中に変わってしまった。何が問題かと言うと、属性を判断する精度が低くなってしまったのだ。

従来のパターンマッチング的、つまり非AIアプローチはオムロン社に代表されるようにかなりの確度でこれを判断できていた。(個人的にはAIより遥かに素晴らしい)しかし、この技術のベースになるアルゴリズムは30年以上前から同じで(追加されているアルゴリズムはあるし、それがスゴイんだけど、ここではあえて無視させていただく。非難しているわけではない)、目、鼻、口などの個々の部品が若いほど密集している(距離が近い)、というのが支配的アルゴリズムなのだ。マスクをすれば、目以外の部品は画像処理的に取得できない。つまり、このアルゴリズムは根本から無力になる。

さて、次はAIアプローチだ。そもそも、海外の学習モデルを安易にもってきて、“弊社のAIはできますよ~”、なんて言ってる会社は悪いけどほぼインチキだ。白人のモデルで作られた学習データは日本人にはそもそも合わない。精度が悪い。

それはさておき、マスクをされてしまった場合、こういった学習モデルが有効なのか?ということだ。AIはブラックボックスなのだ。どこを見て判断しているのかは開発者でさえわからない。ブラックボックスな概念のものに “どうしてマスクしたらわからなくなるかな?” ってのはあり得ない議論なのだ。マスクをした大量の画像データから、新たな学習モデルを提案してくる会社が現れるのは間違いない。これが予想されるトレンドだ。

一方、“マスクをしていても認証できる” という仕組みとの区別をエンジニアや現場が理解できるか?という問題がある。Aさんか、Bさんかという判断をAIができるか?ということ(いわゆる認証)と、属性を判断するのはまったく別な技術なのである。固定された人数から、Aさんか、Bさんがマスクをしていても判断する、というのは極論いうとあまり難しくない。iPhoneがマスクをしていても認証できる、というのはこういうことで、要するの同一性の検出は比較的楽なのである。

新型コロナウイルスは元々脆弱な我々の社会システムを確実に叩いている、すべての社会システムに対してだ。AIは実は周辺エンジニアリング技術がそれを実用レベルにすることができるのだ。元々エンジニアリングを伴わない安易なAIビジネスは、間違いなくコロナに殺されることになるだろう。

Tags: