【人工知能を読み解く④】人工知能の歴史③〜第三次AIブームとディープラーニング〜

この記事はアフィリエイト広告を利用しています。

期間が開いてしまいましたが、シリーズ「人工知能を読み解く」第4回の今回は第三次人工知能ブームについてお話してきたいと思います。

第2回、第3回で第一次・第二次人工知能ブームについてお話しました。期間が開いてしまったので簡単に復習をしておきましょう。

第一次人工知能ブームでは

・1956年のダートマス会議で初めて「人工知能(AI)」と言う言葉が使われた

・「推論」と「探索」についての研究が行われた

・パーセプトロンが開発された

・ハードウェアや技術的問題でブームがさり「冬の時代」に突入した

などのお話をしました。

次に第二次人工知能ブームでは

・知識表現に関する研究に注目された

・第三次人工知能ブームの土台的技術ニューラルネットワークに関する研究が盛んにおこなわれた

・第一人工知能ブームの終焉と同じように技術的な課題に直面し「冬の時代」に突入した

などについてお話しました。

詳しくは第2回・第3回の記事をご一読いただければ幸いです。

【人工知能を読み解く②】人工知能の歴史① 〜第一次人工知能ブーム〜

【人工知能を読み解く③】人工知能の歴史② 〜第二次人工知能ブーム〜

それでは、今回は2010年ごろから始まる第三次人工知能ブームについて簡単にお話してきましょう。

 

第三次人工知能ブームのその前の冬の時代について

引用元: 松尾豊『人工知能は人間を超えるのか ディープラーニングの先にあるもの』

これまで第1次AIブーム・第2次AIブームを見てきました。そしてついに現在の第3次AIブームについてお話していきます。

ですが、その前に第2次AIブームと第3次AIブームの間の冬の時代に起きた出来事についてお話していきたいと思います。

出来事① 「ディープ・ブルー」がチェスの世界チャンピオンに勝利

冬の時代に起きた出来事の一つとしては1997年にIBMが開発したチェス用のスーパーコンピュータの「ディープ・ブルー」がチェスの世界チャンピオンに勝利したという事です。

この「ディープ・ブルー」は1秒間に2億手の先読みを行い、対戦相手の人間的な思考を予測するものでした。この予測には対戦相手の過去の棋譜(対局の記録)をを基にした評価関数(指し手がどのくらい有効であるかを導く数式)が用いられ、効果があると考えられる手筋すべてを洗い出すというものでした。ちなみにこの評価関数は人間に手作業で作成されたものが使用されていました。

この「ディープ・ブルー」の表向きの使命はチェスで人間の世界王者に勝利するというものでしたが、その背景には、より知能的な問題処理能力、高速な計算能力、莫大な量のデータマイニングといった多くの分野に貢献するという目的もありました。実際にIBMは、この研究を通して得た技術を自社製品などに応用しています。

ディープ・ブルーに使用されていたラックの一部

出来事② 「watson」が人間にクイズ王2名に勝利

冬の時代に起きた出来事の2つ目は2011年にIBMが開発した「watson」がアメリカの人気クイズ番組にて2名のクイズチャンピオンに勝利したという事です。

「watson(ワトソン)」はIBMが開発した質問応答システム・意思決定支援システムになります。このワトソンは自然言語を分析して、蓄積された知識を利用して質疑応答を行うシステムです。

クイズ番組では自然言語で問われた質問を理解して、文脈を含めて質問の趣旨を理解し、人工知能として大量の情報の中から適切な回答を選択し、回答する必要があります。IBMはこの技術を、将来的には医療、オンラインのヘルプデスク、コールセンターでの顧客サービスなどに活用できるしています。

また、対クイズ番組では、インターネットに接続されず本・台本・百科事典(Wikipediaを含む)などの2億ページ分のテキストデータ(70Gb程度、約100万冊の書籍に相当)を取り込んで挑みました。

ワトソンの応答システムの仕組みを図にしていますので確認してみてください。

ワトソンの応答システム

第3次AIブーム

それでは今回の本題である第3次AIブームについてお話していきましょう。第三次AIブームの始まりは2010年から2012年頃になり2021年現在も陰陰りを見せていますが続いています。第3次AIブームでは「機械学習」や「ディープラーニング(深層学習)」の研究が盛んに行われています。

第3次AIブームが起こった背景要因としては

  • インターネットの普及による流通情報の増大
  • GPGPUによる計算能力の向上、クラウドサービスの普及
  • 各種問題の解決と学習手法の開発(ReLU関数、Dropout、CNN、Auto Encoder、LSTMなど)

が挙げられます。

今までは専門家が入力層の変数を工夫すること(何が特徴的であるかは専門家が判断していた)で精度を向上させていました。しかし、CNN、Auto Encoderでは、特徴量を自動的に学習することが出来るようになりました。

※GPGPU(General-Purpose computing on Graphics Processing Units)はリアルタイム画像処理に特化したプロセッサ(GPU)を画像処理以外の目的に応用する技術であり応用範囲としてはシミレーション(物理、流体、天体など)、暗号快特(暗号通貨の発掘)、ディープラーニングに使用されています。

 

火付け役である「ディープラーニング」と「機械学習」

第二次AIブームで登場したエキスパートシステムは「開発の為には”人間”が多くの時間と労力をかけて大量の知識を覚えさせる必要がある」という課題が、ブームを終焉させ冬の時代に突入しました。この課題をある程度解決に導いたのが「機械学習」という新しいアプローチであり、機械学習によって「コンピュータが自ら学習して知識を獲得する事」が可能となりました。

そして、この機械学習が注目を集めるなか2012年に開催された世界的な画像認識の精度を競う国際コンペティション「ILSVRC(Image Large Scale Visual Recognition Challenge)」で機械学習の一種であるディープラーニングという手法を用いたチームが圧勝しました。大幅な画像認識の精度向上を達成したことでディープラーニングは大きな期待を集めることになりました。

このコンペティションでは、各グループの開発したAIが与えられた画像に何が写っているのかを分類して、エラー(誤認識)率の低さを競い合います。2012年には従来の機械学習手法で到達していた0.26のエラー率をディープラーニングを用いることで0.16まで引き下げる結果となりました。そして2015年位は人間エラー率である0051を下回る0.036を達成するに至りました。

ILSVRC優勝チームのエラー率の推移

機械学習とは??

まず機械学習について簡単に説明しましょう。

機械学習とは人工知能の一つの手法になります。機械学習とはコンピューターがデータから反復的に学習し、そこに潜むパターンを見つけ出すことです。そして学習した結果を新たなデータにあてはめることで、パターンにしたがって将来を予測することができます。人手によるプログラミングで実装していたアルゴリズムを、大量のデータから自動的に構築可能になるため、さまざまな分野で応用されています。

機械学習には主に2種類の手法が分類できます。一つは既知の入力データと出力データを用いてモデルを訓練し、将来の出力を予測できる「教師あり学習」。

もう一方は、入力データの隠れたパターンや固有の構造を見出す「教師なし学習」といいます。

機械学習の一種であるディープラーニングは教師あり学習、教師なし学習どちらでも応用可能な、機械学習に含まれるアルゴリズムの1つになります。

また強化学習と呼ばれる手法も存在しています。強化学習では試行錯誤を通じて、報酬(評価)が得られる行動や選択を学習します。

出典:総務省ICTスキル総合習得プログラム 講座3-5 (https://www.soumu.go.jp/ict_skill/)

ディープラーニングが革新的である理由

ディープラーニングは機械学習の一種であり、大量のデータを用いて、機械が自動的にデータから特徴を抽出して学習する技術の事です。

仕組みとしては、人間の脳の神経回路(ニューロン)を模倣したシステムであるニューラルネットワークという構造が元になっています。このニューラルネットワークを多層化したものを用いて学習することをディープラーニング(深層学習)と呼んでいます。

ディープラーニングのしくみ
ディープラーニングのしくみ

従来の機械学習では、より精度(=正確さ)を高める為には、特徴量の設計を人間が調整する必要がありました。ディープラーニングで革新的なのは、完全にコンピュータ自身で特徴量の設計を作る事が出来るようになったという点です。

例えば、これまで猫の画像を見て「これは猫である」という識別を行うために「耳がとがっている」などの猫の特徴をすべて人間が指定しておく必要がありました。画像のどこに注目すべきか?という膨大な選択肢がある問題に対し、素早く正確に判断する事ができなかったからです。

また、革新的な理由としてディープラーニングでは、従来苦手としていた画像や音声、テキストなどの非構造データも扱えるという点も大きな進歩として挙げられます。構造データはExcelデータのような数値を用いた表形式のデータを指し、非構造データはその他の構造化されていないデータを指します。

ディープラーニングの応用例

ディープラーニングを用いた人工知能サービスの代表例として、画像認識、音声認識、音声合成、テキスト処理、翻訳が挙げられます。

ディープラーニングの応用例
出典:総務省ICTスキル総合習得プログラム 講座3-5 (https://www.soumu.go.jp/ict_skill/)

ディープラーニングの課題

万能にも思えるディープラーニングにも、今後克服していかなければならない課題が存在しています。

  • 多くの手法では、一定のデータ量がないと精度を出すことが難しい
  • ブラックボックス化しており、動作や判断した結果に関して説明する事が難しい(ブラックボックス問題)
  • データに誤りがあると、偏った判断が発生してしまう可能性がある(データバイアス問題)
  • 特定のノイズを加えるだけで誤認識する場合がある(脆弱性問題)

 

まとめ

第三次AIブームでは「ディープラーニング」技術が注目され研究が行われています。

このディープラーニング技術により人工知能は革新的に進化する事ができました。しかし、課題も多くこの課題を乗り越えることでさらなる進化が期待できます。

これから人工知能はどのように進化していくのか楽しみです。

3回にわたって人工知能の歴史についてお話してきました。今後は人工知能の技術的お話や詳しい応用例、これから可能性などをお話していきたいと思います。

おすすめ書籍

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第3版

高校数学でわかるディープラーニングのしくみ

概説 人工知能 ――ディープラーニングから生成AIへ (ちくま学芸文庫 マ-54-1) 

AIセキュリティから学ぶ ディープラーニング[技術]入門

GANディープラーニング実装ハンドブック

番外編

番外編です。

人工知能とは関係ありませんが、弊社にて【漫画でIT入門】「とあるIT企業の社員活動日誌」の連載を担当していただいておりますtan0先生より残暑見舞いのイラストを頂きましたのでご掲載させていただきます。

tan0先生、誠にありがとうございます。

 

残暑見舞い申し上げます。

これからも【漫画でIT入門】「とあるIT企業の社員活動日誌」をよろしくお願いいたします。

【漫画で入門】「とあるIT企業の社員活動日誌」各話一覧はこちら

たんれ~ イラスト


たんれ~

イラストレーター兼漫画家
主にインターネットの海で女の子を描くのが好きな人
猫派よりも犬派

Twitter:@tanrei0303

Pixiv:tan0