
人工知能(AI)開発の最先端を支えるディープラーニングの技術は、この10年でAIの可能性やそのパフォーマンスに抜本的な革新をもたらしました。ディープラーニングの発展によってAI開発が飛躍的な進歩を遂げただけでなく、ディープラーニングという技術そのものもアップデートを繰り返し、より高い結果をもたらす技術として注目されています。
今回は、そんなディープラーニングが精度を高めることで、どのような技術が可能になるのかについて、最新の事例を踏まえながら紹介します。
ディープラーニングとは
そもそもディープラーニングは、日本では「深層学習」という名前でも知られている、最新の機械学習手法の一種です。
AIが人間のような意思決定ができるようになるためには、大量のデータを読み込ませることで、判断能力を養わなければなりません。この際に行われるのが「機械学習」と呼ばれる工程です。
従来の機械学習に比べ、ディープラーニングは複雑な意思決定ができるよう設計されているため、高度なタスクにもAIを活用できるきっかけをもたらしました。まだまだ開発コストは決して安くはないものの、ディープラーニングの登場によってAI開発のスピードや精度は飛躍的に向上し、最先端の技術開発の現場では欠かせない存在となりました。
すでに市場に出回っているAI関連製品の多くにもディープラーニングは実装されており、高精度なサービス提供を自律的に行うことができます。
ディープラーニングの仕組み
高度な機械学習を実現するディープラーニングを支えているのは、「ニューラルネットワーク」と呼ばれる構造です。ニューラルネットワークは、人間の神経細胞の働きから着想を得たネットワーク構造で、複数の階層に分かれてインプットした情報を処理する特徴を備えています。
「入力層」「中間層(隠れ層)」「出力層」と呼ばれる3つの層をデータが行ったり来たりすることで、データが持つ特徴に重みづけが行われていき、判断材料を自発的に磨いていくことができるというものです。
近年のディープラーニングで採用されているのはこの仕組みを発展させた「多層ニューラルネットワーク」と呼ばれるアプローチで、データを移動させる層の数を増やしたことで、高度な分析が行えるようになりました。
教師あり学習とディープラーニングの違い
ディープラーニングは最新の機械学習手法として広く知られていますが、ディープラーニング登場以前に知られていたのが「教師あり学習」と呼ばれる手法です。これら2つの手法は異なるアプローチで学習を行うため、その違いについて理解しておく必要があるでしょう。
教師あり学習の特徴
教師あり学習は、人間がAIにあらかじめ答えを教えておきながら、意図的に答えへ近づくように仕向けるための学習手法です。わかりやすい例としては、りんごとみかんの違いを画像から判別できるAIが挙げられます。
りんごとみかんを判別できるAIを教師あり学習によって開発する場合、まずはりんごとみかんの画像を用意した上で、その画像にテキストデータで「りんご」や「みかん」といったタグづけを行います。
データを読み込む際、AIは開発者が付与したタグ、いわゆるメタデータを参考にしながら画像を読み込むので、あらかじめその画像が捉えている写真が「りんご」なのか「みかん」なのかを把握した上で学習を進められます。そのため、短期間でAIに果物の判別基準を刷り込ませることができます。
教師あり学習は効率的で精度も確保しやすいですが、データを加工する負担が発生したり、人知を超えた意思決定はできなかったりする点が欠点として挙げられます。
高度なAI開発には大量のデータを用意する必要がありますが、メタデータを付与する作業は人間が行わなければならず、これはデータの数が多いほど大きな負担を生み出すため、効率的なAI開発を妨げます。また、教師あり学習はあくまで人間が「教師」となってAIに判断能力を与えるため、人間の判断能力を超えてAIがポテンシャルを発揮することはできません。
ディープラーニングの特徴
教師あり学習の課題解決に役立つのがディープラーニングです。
ディープラーニングの最大の特徴は、読み込むデータに教師となるメタデータを必要とせず、AIが自ら特徴量、つまり判断基準を発見できる点にあります。データ加工の必要もなければ、判断基準を人間が示せる必要もないので、負担軽減はもちろん、人知を超えた意思決定も可能にすることができます。
そのため、教師あり学習では不可能だったハイテクなAI活用の推進も、ディープラーニングの登場によって実現することとなりました。
ただ、ディープラーニングも教師あり学習の完全上位互換かというとそういうわけではなく、運用の際にはコストの問題などもあり、教師あり学習が完全に陳腐化したわけではありません。
ディープラーニングは運用のためのスキルも高度であることから、比較的簡単に取り組むことができ、成果も出やすい教師あり学習との併用が求められています。
高精度なディープラーニングが実現することで運用可能になる技術
運用負担がそれなりにあるとはいえ、最新技術を存分に活かせる大企業を中心に、高精度なディープラーニング技術の活用が進んでいます。ディープラーニングが実現することで、次のような技術が既に登場しつつあります。
リアルタイムの映像・画像処理
代表的なディープラーニングの活用方法として、リアルタイムでの映像・画像処理があげられます。防犯カメラのリアルタイム映像を使って写っている人間の顔や人数を特定したり、現場のカメラで撮影した写真をもとに本人確認を実施したりと、高い精度が求められる現場においても活躍していることが強みです。
自動運転
リアルタイム映像の処理能力を発展させた活用方法ともいえるのが自動運転です。人間のような判断能力を車載カメラの映像分析によって実現し、ハンドリング操作やブレーキ操作を実現します。
自動車の運転には多くの判断が求められるため、長年コンピューターによって制御することは困難とされてきましたが、ディープラーニングの登場によってAIの判断能力が飛躍的に向上し、今では完全自動運転の車も登場しつつあります。
自然言語処理
日本語や英語、中国語など、人間が日常的に使う自然言語をコンピューターが解釈する能力も、ディープラーニングの力で飛躍的に向上しました。10年前は単語の羅列でしかなかった機械翻訳も、ディープラーニングが採用された翻訳サービスを使うと、まるで人間が翻訳したかのような文章が自動で生成され、翻訳業務の自動化が進みました。
また、文章をゼロから生成する技術に関しても、書き手の特徴や文章の目的などに合わせて自在に文体を変えられるようになり、本当に人間が書いたような文章が次々と登場し、業務の効率化につながっています。
高精度な結果を残したディープラーニングの運用事例
では、実際にディープラーニングを活用して高い精度の結果を残している運用事例を紹介しましょう。
NTT株式会社
NTT株式会社では、自動車から見える景色や周辺情報についての雑談を行うAIの開発を実現しています。同社が収集した膨大な数の対話モデルをディープラーニングによって分析することで、シチュエーションに応じた最適のコミュニケーションや情報共有を実現しました。
ドライバーの居眠り運転などを回避するとともに、周辺のおすすめスポットや目的地検索などのナビゲーション機能の延長線上としての採用が期待されています。
テルアビブ大学
イスラエルのテルアビブ大学の研究チームは、ディープラーニングによってAIが取り込んだ動画に写っている人間の顔を、その顔のアイデンディティを維持しつつ年齢を変えて若くしたり老化させたりする技術を開発しました。
顔の特徴はそのままに、口や目の調整を加えることで笑顔を作ったりすることはもちろん、将来の老け方や性別を変えたときの人相に至るまで、非常に高いレベルでディテールを再現できることがわかっています。実写映画の編集はもちろん、3Dアニメーションの映像制作にも応用が可能になるなど、エンターテイメント分野での活躍が期待されています。
株式会社ELYZA
東京大学発のベンチャーとして注目を集めるテック企業の株式会社ELYZAは、自然言語の中でも特に分析が難しいとされる日本語分析を飛躍的に進化させるAI開発を進めています。
同社が開発した日本語特化AIエンジン「ELYZA Brain」は、文章から重要な情報を整理し、文章を作成する「生成型」のAIとして注目を集めます。議事録などを読み込ませることで、そこから必要情報を自動でまとめ上げ、読み手が求める情報を瞬時に把握できるよう編集作業をサポートします。
「読む、書く、話す」の業務が数多く発生する保険業界や法律業界での注目度が高く、現在は実装に向けたテスト段階にあります。
ディープラーニングの精度向上に必要なポイント
ディープラーニングは高い精度が期待できる技術である一方、精度を高めるためには開発に工夫も求められます。精度向上に必要なポイントとしては次の4点です。
とにかく大量のデータを用意する
まず重要なのが、とにかく学習用のデータを大量に集めることです。ディープラーニングは教師あり学習のようなデータ加工の手間が省ける反面、学習を後押しするためにそれ以上のデータ量を必要とします。
データ量が不足していると、AIは正しく学習が行えず、期待しているような精度は得られません。そのため、ディープラーニングを正しく運用するためには、まず膨大なデータの確保を急ぐところから始めましょう。
大量のデータを短期間で処理できるGPUを用意する
大量のデータを確保できても、それらを適切に処理できるGPUがなければ開発コストはかさみます。GPUは高い処理能力を持つユニットであることから、AI開発の現場で頻繁に採用されています。
家庭用のGPUではディープラーニングで求められるような処理を実現することは難しく、GPUサーバーのような大量のリソースを確保できる環境の用意が必要です。近年はGPUをクラウドで確保するケースも増えているため、本格的なディープラーニング運用を検討の際には積極的に活用しましょう。
転移学習を活用する
転移学習は、既存の学習モデルを活用してAI開発を行う手法です。転移学習はゼロからAIを開発する必要がないため、開発にかかるコストを削減し、精度を高めることができます。すでにAI開発に着手しており、既存モデルを有している場合は、それらを有効活用しながらディープラーニングを運用しましょう。
常に新しいアプローチを試す
AI開発は最先端の研究分野であるため、日夜新しい開発手法が模索されています。ディープラーニングについてもそのポテンシャルは高く評価されており、まだまだ研究の余地はあります。
最新の研究動向にも常に目を向けながら、新しい手法でなおかつ試していない、有力そうなものがある場合には積極的に取り入れてみるのがおすすめです。
まとめ
ディープラーニングは最先端のAI開発手法ということもあり、さまざまな領域で確かな成果を残しています。ただ、ディープラーニングの運用にはデータの確保やリソースの確保など、超えるべき課題も多いため、それらの負担を少しでも軽くすることが大切です。
当社モルゲンロットが提供する「M:CPP」では、そんなディープラーニング開発に活躍するクラウドGPUを、リーズナブルな価格で提供しています。
大手クラウドよりも価格を抑え、AMD社の最新のGPUを専有サーバーで提供しているため、そのパフォーマンスも折り紙付きです。ディープラーニング開発の負担軽減の方法をお探しの際には、お気軽にご相談ください。