AIとは結局なに?わかるようでわからない人工知能を理解しよう!

ここ数年「AI技術の進歩により仕事がなくなる」「色んな作業が自動化できる」というような噂と共にAI、機械学習、ディープラーニングという言葉を良く耳にするようになりました。
特にWeb/ITの分野ではそれらの技術を活用したサービスやアプリが増えています。
しかし、いざ「AIって結局なんなの?」と聞かれた時にあなたは答えることができますか?

フロントエンドエンジニアのくめっちです。
エンジニアという職業をやっているとその手の話題に詳しいと思われているのか、上記のような質問をされることがあります。
確かに近年ではAI関連の技術を使用したサービスなどが次々と生まれていますが、具体的にどの部分でAIが使われていて結局何ができるのかをあまり理解しないで使っている場面が多いのではないでしょうか。
今回はそんな「わかるようでわからない」AI、機械学習、ディープラーニングなどについて調べた内容をお話していきます!

そもそもAIって何?

そもそもAI関連の単語として人工知能、機械学習、ディープラーニングなど様々な呼び名を耳にする機会があります。
早速調べていくに当たって「〇〇 とは」と検索する方も多いと思うのですが、一体どの単語から調べていけばいいのでしょうか。
上記のような単語の中でみなさんが一番聞き覚えがある単語ってなんですか?

僕が一番馴染みがある単語は「AI」です。
みなさん、「A.I.」っていう映画を知っていますか?
https://www.amazon.co.jp/dp/B00RUV5LI8

2001年に上映されたスティーブン・スピルバーグ監督作品で、人工知能を持つロボットが主人公の作品です。

この映画の影響なのかはわかりませんが、確かにAIと聞いた時に自分で考えて動くようなロボットってかなり想像しやすいモノの1つですよね。
では「AI = 自分で考えて動くようなロボット」なのでしょうか?実際に調べてみましょう。

人工知能
【英】AI, Artificial Intelligence
人工知能とは、人間の知的営みをコンピュータに行わせるための技術のこと、または人間の知的営みを行うことができるコンピュータプログラムのことである。一般に「人工知能」と和訳される。
引用:https://www.weblio.jp/content/%E4%BA%BA%E5%B7%A5%E7%9F%A5%E8%83%BD

「知的営み」…。わかるようでわからないですね。
というかAIって「artificial intelligence」って言葉の略だったんですね。
言われてみれば上記の「A.I.」のジャケット写真にも書いてありました。

ちなみに、wikipediaでも調べてみたところ

「〜ともされる。」
「こう呼ばれることもある。」
「〜のようなものがある。」

というように割とふわっとした書き方をしていることが多く、どうやら様々な解釈を持つ言葉のように見受けられます。

色んなサイトをかいつまんでみると下記のようなものをAIと定義できるようです。

  • 人工知能(artificial intelligence、AI)
  • 知能を研究する分野
  • 知的行動を人間に代わってコンピュータに行わせる技術

ひとまずロボットそのもののことではなくそれを実現した技術や分野のことを指しているようですね。

AIが使われているアプリやサービス

AIについて調べてみましたが「知的行動」とはどんなものがあるのでしょうか。
昨今ではAIを使用したモノやサービスが次々と生まれているので実際にそれらを見ていった方が早そうです。
今回は機能別にいくつかピックアップしてみました。

言語認識

Google翻訳

最初は言わずと知れたGoogle翻訳。

AIを導入したことにより、従来の単語レベルの翻訳から文章を違和感のないレベルにまで翻訳できるようになりました。僕自身、プログラミング技術を検索している時に海外のサイトを見ることも多々あるので非常にお世話になっています。
近年では手書き入力の識別やリアルタイムでの会話に対する翻訳まで行なっているとのことで、もはや「言語認識」というカテゴライズでは収まりきらないほど高性能なサービスとなっています。

女子高生AI「りんな」

冒頭の映画に引っ張られているのかもしれませんがAIが人間の言葉を理解するって、SFチックでわかりやすい先進技術ですよね。
Microsoftが公開している「女子高生りんな」はチャットツールの「LINE」を使って実際に会話をすることができます。

2015年に「女子高生AI」としてデビューして以降、話題を呼び2019年3月時点では登録ユーザー数が約763万人を突破したそうです。そのうちの1人が僕です。
歌を歌うこともできるようで2019年4月には、avexとレコード契約を行いメジャー・デビューも果たしたとのこと。他にも有名ラッパーとのフリースタイルバトルを行なったり、スマートフォンのカメラに写ったものに対してリアルタイムで答えたりと、凄まじい速度で成長しています。

音声認識

Siri

Apple製品を愛用している人であれば誰でも知っている有名な音声認識機能。
上記画像の中にもある通り、機械学習によって日々進歩しています。
喋りかけるだけで検索や通話、メッセージの作成はもちろん、簡単な会話の応答もできます。

実はiPhoneを長らく愛用している僕は、数年前にSiriを使用した際、あまり正確に音声を読み取ってくれなかった経験があったので、つい最近まで「なんだかんだその程度」と思っていたのですが…
実は現在、声で持ち主を判別できるほどの進化を遂げているのです。
実際に知り合いとiPhoneを並べて「Hey Siri」と呼びかけたところ、しっかり持ち主の声だけに反応するようになっていました。
日々改善が進んでいて2,3年も前の知識や認識をひっくり返すほどの技術。今後も楽しみですね。

Neutron

こちらiZotopeという海外の会社が作成している音楽編集ソフトになります。
実は僕、Web業界に入るまで長らく音楽制作を行なっていた経験もあり、今でも趣味でそれらを行うにあたりこのソフトを愛用しています。完全に僕の趣味全開です。
わかりやすいようにざっくり説明すると、音楽をこのソフトに聞かせると自動的に「ミックス」や「マスタリング」といった、曲を「良い感じに仕上げる」作業を行なってくれる代物になっています。

例えば既存のCDの音を聞かせるとその音に近くなるように編集してくれたり、楽曲の1パートを聞かせるだけでそれが何の楽器の音なのかを判別して最適な処理をしてくれたりします。
音楽制作の世界ではこのようなソフトがここ数年で次々と生まれていて、サウンドエンジニアという職業がなくなってしまうのではないかと囁かれているほどです。

画像認識

pixiv Sketch

こちらは国内最大規模のイラスト共有プラットフォーム「pixiv」が提供するアプリケーション。
機能としては画像などの線画をアップロードすると、自動で着色をしてくれるサービスとなっています。どのような雰囲気で塗っていくかを選ぶこともできるため、イラストレーターなどにとっては時短ツールとしても使用されているようです。これからそれらの職業を目指す人にとっては一種の学習ツールとしても使えそうですね。

Tegaki

こちらは手書きの書類をAI技術を使用して読み取り、データ化してくれるサービスです。
多言語にも対応し、チェックボックスなども読み取ることができるので事務処理を劇的に簡略化できそうですね。実際に導入企業にも誰もが一度は聞いたことのあるであろう、名だたる企業が連なっています。
このようなサービスがもっと一般企業にも普及していけば、いずれほとんどの書類がデータ管理できる世の中になりそうですよね。

その他

Adobe Sensei

やはりWeb業界のメディアとして運営しているのでこちらは忘れてはなりません。
Photoshop、Illustratorなどでお馴染みのAdobeの技術です。

その他としてご紹介させていただいていますが、このAdobe Sensei、画像の認識やそれに対応した編集はもちろん、プロジェクトに適した素材データの自動検索など様々なソフトや機能の総称となっています。
Web業界ではやはりPhotoshopの使用頻度が高いので、パペットワープや選択範囲の塗りつぶしなどの技術において大きな恩恵を受けています。Adobeは研究中の技術も定期的に発信していて、日々成長を遂げているので今後の発展にも目が離せませんね。

AI、機械学習、ディープラーニング、色々聞くけど何が違うの?

上記のようなサービスやアプリでどのようなことができるのかはわかりましたが、具体的にはどのような技術を利用して実現しているのでしょうか。冒頭で調べたAIの定義だけだと、イマイチ何がどうなってこんな革新的なコンテンツが作られたのかわかりませんね。

AIについて調べていると必ずと言っていいほど「機械学習」や「ディープラーニング」という言葉が出てきます。
そこで先ほど調べたAIとはどのような関係があるのか調べてみました。

どうやらマシンラーニング(機械学習)とディープラーニング(深層学習)はAIの一つの側面で、これらの技術が急速に発展していることにより注目を受けているようです。

  • マシンラーニング(機械学習)は人間が設定した判断基準を元に認識などを行う技術
  • ディープラーニング(深層学習)は機械がデータを元に独自に判断して認識する技術

わかりやすい例で猫を題材にしてみましょう。
猫の特徴といえば下記のようなものがあります。

  • 四足歩行
  • 毛が生えている
  • 尻尾が生えている
  • 耳が頭の上にある

これらを猫の判断基準として事前に設定することによって、画像などを見たときにそれが猫なのかどうなのかを判別するのがマシンラーニング(機械学習)です。
しかし、上記のような特徴のみでは猫の尻尾が見えない角度であったり、しゃがみこんでいて足の本数がわからなかったりと状況によって見え方は違うので、様々な判断材料が必要となり実用化には今ひとつ足りません。

そこで脚光を浴びるようになったのがディープラーニング(深層学習)です。
マシンラーニングのように判断基準を設定するのではなく、大量の猫の画像サンプルを渡すことによって独自に猫の特徴を判別して画像の識別を行えるようになりました。

ディープラーニングが世に普及した理由としては様々な要因がありますが

  • インターネットの普及によって膨大な学習データが手に入りやすくなった
  • PCの発展により高度な処理を行うことができるようになった
  • それに伴い機械学習を簡単に行う技術の研究が急速に進んだ

という複数の理由に起因しているようです。

そして今回ご紹介したサービスやアプリは、AIというよりもこのディープラーニングを応用することで、ここ数年で人々の手の届く範囲にまで組み込まれるようになったということです。
冒頭で挙げたようなロボットなどのSFチックで非現実的なものから、個人単位で触れることの出来る現実的な技術に発展したことが、ここ数年のAI技術の台頭に繋がっているわけですね。

今後どうなっていくのか?

今回はAI関連の技術について一つずつ紐解いていきました。

まとめると以下のようになります。

  • AI = 知的行動を人間に代わってコンピュータに行わせる技術や分野などの概念
  • AI(人工知能)> マシンラーニング(機械学習) > ディープラーニング(深層学習)
  • 様々な要因でディープラーニングが発展したことにより急速に世の中に普及してきた

調べていく中で、一つずつ掘り下げていくとまだまだ細かい内容があるのですが、ひとまず「わかるようでわからない」状態から「実例を含めて人に説明できる」状態になったのではないでしょうか。

AIを活用したサービスは今回紹介した以外にも、この記事には到底収まらないくらい急速な勢いで人々の生活の一部に組み込まれていっています。
冒頭の映画に出てくるロボットは制作当時、完全なるフィクションだったと思いますが今はどうでしょうか。今回の実例で使われている技術ですら

  • 翻訳やチャットでの会話といった人の言語を理解し応答する技術
  • 音声ガイドや楽曲制作ツールといった音声から情報を読み取り判断する技術
  • 着色機能や文字の認識といった視覚情報を判別しそれに応じた処理をする技術

この3種類に人の肉体を摸したロボットという媒体を作成する技術が加われば、人とコミュニケーションを取ることができるロボットなら実現可能な気がしませんか?

つい先日、「汎用人工知能(Artificial General Intelligence, AGI)」という技術を研究している、OpenAIというAI研究の非営利組織に、みなさまご存知のMicrosoftが10億ドルの出資をすることを発表するというビッグニュースがありました。
参照:https://www.gizmodo.jp/2019/07/microsoft-open-ai.html

このような名だたる企業からも注目を集めている分野なので、今まで以上に関心が高まっていきそうですね。
既にフィクションの実現は近いのかもしれません。

ここ数年で発達した技術といえど、2,3年前では想像もつかなかったようなことが出来てしまうほどに急速に発展を遂げています。今回、まだその入り口に過ぎないのかもしれませんがそれらの技術の一端を知ることが出来たので、今後はそれをどのように活用して新たに何ができるのかを考えていきたいと思います。

HTMLやCSS、JavaScriptの学習をしている方に向けて無料のコーディング課題をKROWLサイトで配布中!
難易度別に用意してあるサンプルサイトのデザインデータを元に、サイト制作のスキルを磨こう!

関連記事