データ活用
2021-10-11
データ活用
2021-11-08
スマホなど身近な機械にも AI 技術が使われるようになった現在、 AI 関係の用語は世間で当たり前のように使われるようになっています。しかし実のところ、それらの言葉の意味を正確に説明できる人はどれほどいるでしょうか。そこで本記事では、 AI と機械学習、ディープラーニングそれぞれの違いや関係について解説していきます。
「AI」と「機械学習」、「ディープラーニング」はそれぞれどのような概念で、どのような違いがあるのでしょうか。
人工知能という言葉に示されているように、 AI は「自然言語処理能力」「画像認識能力」「音声認識能力」「推論能力」など様々な知的能力を持っています。 AI は、様々なデータを保存・分析する中で、これらの機能を高めることが可能です。 AI の「機械学習(マシンラーニング)」とは、 AI によるこの学習行為、あるいは学習能力そのものを意味します。
ディープラーニングは、この機械学習の最新モデルとも言うべきものです。ディープラーニングは、 2006 年にジェフリー・ヒントン氏らによって開発され、日本語では「深層学習」と訳されます。ディープラーニングの開発によって AI の学習効果は別次元と言えるほど改善され、結果としてAIの各種機能も飛躍的に向上しました。
以上を要約すると、 AI の機能のひとつに機械学習があり、機械学習の一種としてディープラーニングがあるというのがこの三者の関係です。
そもそも AI とは”Artificial Intelligence”の略語です。AIの正確な定義は研究者のあいだでも意見が分かれていますが、一般的には、「(人間の)知性と言われる能力を再現するコンピュータープログラム」と理解してよいでしょう。「人間のように考える機械」と表現されることもありますが、実際にはまだ、人間ほど柔軟な知能を持ったAIは実現していないのが現状です。AI分野の開発には、Pythonなどのプログラミング言語が用いられます。
機械学習とは、与えられたデータを解析し、そのデータを元に物事を学習する AI の機能です。あるいは、そうして学習したことを適用して判断を行うアルゴリズムをも含んで機械学習と言う場合もあります。 AI の機械学習の方法としては「教師あり学習」「教師なし学習」「強化学習」などがあります。以下では、そのそれぞれの特徴について解説していきます。
教師あり学習とは、あらかじめラベリングしたデータを入力することによって、 AI にルールやパターンを学習させる手法です。たとえば「犬」と「猫」の見分け方を AI に学習させたい場合、人間があらかじめ「犬」と「猫」の画像データをそれぞれラベリング(分類)した上で AI にデータをインプットします。 AI はそのラベルに基づいて犬と猫の特徴を学習し、その後はラベリングされていないデータをインプットされた場合でも、学んだルールを元に、その画像が犬なのか猫なのか正しく情報を処理できるようになります。
教師あり学習の活用事例として一般に利用されているものとしては機械翻訳が挙げられます。機械翻訳とはその名の通り教師となる翻訳データをコンピューターに学習させることで、自動的に翻訳する技術のことです。データは膨大なほど翻訳の精度も向上するため、特にメジャーな言語の翻訳では教師あり学習が採用されています。
たとえば有名な翻訳サービスである「Google 翻訳」では、 Google が収集してきた対訳文書を教師となるデータとして用いています。そのデータを元に統計学的に分析して、近いデータを求めることで翻訳を行っているのです。また、ドイツの AI システム開発会社が提供する「DeepL 翻訳」も教師あり学習が用いられています。同社では DeepL の前身である Linguee というオンライン辞書サービスのために、あらゆるテキストデータを収集し、パソコンで検索できるデータベースを作成していました。独自のデータ収集エンジンや学習するアルゴリズムの開発で、他社と差別化を図る翻訳サービスを提供していると言われています。
教師なし学習とは、大量のデータを元に、 AI 自身がパターンやルールを分類する学習方法です。つまり教師なし学習は、教師あり学習とは対照的に、ラベリングされていないデータを解析して自ら分類(クラスタリング)するのです。これらのアルゴリズムは、人間の手を必要とせずに、隠れたパターンやデータのグループ化を行えるため、 AI 開発における労力を大きく削減できます。
教師なし学習の活用事例としては、特に画像分類が挙げられます。画像分類とは画像に映った被写体をコンピューターが認識し、学習したルールに従って画像の種類を判別する技術です。画像には上記で紹介した言語翻訳のような、規則性がありません。そのため教師あり学習のような「教師データを学習させ、そのルールを元に判断する」ことが難しくなります。
ラベリングされていないデータを解析して画像分類するためには、教師なし学習が必要になります。東芝などの有名企業も画像認識 AI を積極的に開発しています(参考: https://www.global.toshiba/jp/technology/corporate/rdc/rd/topics/21/2104-01.html)。こうした画像分類機能を使えば、撮影した画像を自動で種類別にフィルタリングしたり、工場において製品の外観検査を自動化したりすることが可能になります。
強化学習とは、教師なし学習と同様に正解のデータは与えられず、試行錯誤を通して AI 自身が 1 からデータのパターンやルールを覚えていく機械学習の一種です。強化学習において AI は、望ましい結果に報酬を与えることで、価値が最大化したデータを出力できるように AI を成長させていくことができます。
強化学習の代表的な活用事例として強化学習の代表的な活用事例としては、自動車の自律運転が挙げられます。狭い道路や車が密集した交差点など、不規則な対応が必要となる自動車の自律運電においては、強化学習が最適とされているのです。何度も様々なシチュエーションを学習させることで、安全な自律運転ができるよう開発が進んでいます。
ディープラーニングは、機械学習の一種で、その最新モデルとも言うべきものです。ディープラーニングの特徴としては、とりわけ「ディープニューラルネットワーク」を用いた自律学習が可能であるという点が挙げられます。以下では、この「ディープニューラルネットワーク」というキーワードを軸にしてディープラーニングについて解説していきます。
ディープラーニングの高度な学習効果を実現させているのが、「ディープニューラルネットワーク(DNN)」と呼ばれるアルゴリズムです。ディープラーニングは、人間が結論を出すのと同じような論理構造でデータを継続的に分析するように設計されています。そして、これを実現するために、ディープラーニングでは、人間の脳の仕組みにヒントを得た「人工ニューラルネットワーク」または単に「ニューラルネットワーク(NN)」というアルゴリズムを用いているのです。ディープラーニングに対応させて4層以上で構成された NN を特に DNN と呼び、この多層構造によってディープラーニングは従来以上の学習能力を実現しています。
CNN(畳み込みニューラルネットワーク)は、上記の NN の一種で、特に画像や映像のデータ処理の領域などで多く使用されています。 CNN のアーキテクチャは、人間の視覚野の構成にヒントを得ており、これによって画像内の様々な特徴から、それらを自動的にフィルタリングすることができます。たとえばスマホや空港などでも使われている顔認証機能や、カメラの笑顔検知機能なども、ディープラーニングによってその精度を高めているのです。
RNN(再帰型ニューラルネットワーク)とは、音声認識や自然言語処理によく用いられる NN の一種です。 RNN は、データを時系列的に認識し、パターンを用いて次に起こりそうなシナリオを予測することができます。現在では RNN を活用した AI による文章の自動生成技術の研究も進んでおり、 AI が記事や小説を執筆するということも現実的になっています。
本記事では、「AI」「機械学習」「ディープラーニング」それぞれの違いや基本的概要について解説しました。 AI の機能のひとつに機械学習があり、機械学習の一種としてディープラーニングがあるというのが、三者の基本的な関係です。機械学習にはディープラーニング以外にも様々な種類があり、それぞれに AI の特徴的な機能を高めています。