今さら聞けない機械学習(1)〜機械学習とは

AI /

まずAI(人工知能、以下AI)=機械学習(ディープラーニングなども含めて)ではない。コンピュータに人間に近い、もしくは人間を超えた判断能力を持たせたい、という試みは遥か昔から行われており、その到達点のイメージとして、AI(AIシステム)と呼んでいる。そして、それを実現するアルゴリズム(システムのやり方、計算方法)として、機械学習という手法が有効であると考えられている。さらに機械学習自体にもたくさんのアルゴリズムがあり、よく聞くニューラルネットワークというのも、そのアルゴリズム、手法の一つである。

では、機械学習とは何か。きわめて簡単に説明すると、コンピュータに何かのデータを与え、コンピュータ自らがその特徴を抽出し、何かしらの結果(判断など)を出す、というものだ。あたかも機械が学習しているように見えるのでこう名付けられた。

機械学習が一般化、発展するまでは、ルールベースと呼ばれる、人間がルールをコンピュータに教える方法が一般的だった。たとえばコンピュータに牛と馬を画像で判断させる場合。ルールベースの場合、牛には白、黒の模様があり、鼻はこんな形で、しっぽはこんな感じで、というように(馬の方も同じようにルールを教える)人間がその特徴を分析、分解し、コンピュータに教えていく。教えられたコンピュータは牛か馬の画像を見せられたとき、これらのルールを総合的に判断し、牛か馬か、という判断を下す。一方、機械学習は、これは牛、これは馬とだけ印をつけた(これをラベリングといいます)画像をコンピュータに渡す。(これを教師あり学習といいます)コンピュータは牛、馬の画像から自動的に特徴を抽出し、牛と馬の区別がつくようになる。では、なぜルールベースではなく、機械学習がもてはやされるのだろうか。その理由はルールを考える人間の能力と時間が膨大に要求されるからである。コンピュータに牛と馬を確実に区別させるためには、人間がその画像の特徴を何十個も何百個も見つけ出さなければならない。犬と猫の場合だったら、それらの特徴抽出はもっと困難になります。機械学習はこれをコンピュータが自動的にやってくれるわけだ。

ですが、ここに多くの人が陥りやすい間違いが存在しています。機械学習を行っているコンピュータは“毛色”、“鼻”、“目”がこういうのは犬、とは判断していない。あくまでも、画像の“何かしら”の特徴で区別しているだけです。そして、その画像の特徴とは、最後はあくまでも数値でしかありません。機械学習のプロジェクトを進める上で、一番肝に命じなければいけないのは、“最後は数値化された特徴”でしか判断していない、ということなのである。

【関連記事】
・今さら聞けない機械学習(1)〜機械学習とは
・今さら聞けない機械学習(2)〜機械学習のアプローチ
・今さら聞けない機械学習(3)~機械学習ができること
・今さら聞けない機械学習(4)~機械学習プロジェクトをスタートさせる条件
・いまさら聞けない機械学習(5)~正解率のワナ
・今さら聞けない機械学習(6)~コンピュータビジョンのワナ
・エッジAIは単機能化してサブスクリプションモデルに向かう
・日本のモノづくり復権の鍵はインダストリー4.0の受容
・インダストリー4.0の世界「モノからコトへ」

Tags: