参加レポート：AI・ビッグデータ活用実践講座「AIで何ができる？ビジネス活用の可能性を学ぶ」

参加レポート：AI・ビッグデータ活用実践講座「AIで何ができる？ビジネス活用の可能性を学ぶ」

2019.02.26

2018年10月14日、徳島大学の教授4人による「AI・ビッグデータ」に関する講座に参加してきました。

「AIで何ができる？ビジネス活用の可能性を学ぶ」と題して、AIがどのように産業応用されているか、ビジネスの役に立つか？をテーマにした講座です。
当日は事前に聞いていた予約枠の2倍近い参加者がいたと思います。農業系企業の総
務責任者やIT企業の経営者など面識のある方もおられ、分野に限らず関心の高さを感じました。

4人の教授陣は企業との共同研究の実績も豊富な方々ですので、実例を交えての講座でとても興味深く拝聴しました。
AIの基礎的な解説やディープな話も出ましたので、ビジネス活用という枠に収まらない話もありますが文系出身「AI初心者」の私にはとても分かりやすく、面白い講座でした。
少しでもその内容をお伝えしたいと思いましたので、レポートをさせて頂きます。

（１）AI技術を用いたマルチメディアシステム：獅々堀正幹教授
（２）自然言語処理～曖昧な日本語をコンピュータに理解させる技術～：泓田正雄教授
（３）音声処理～対話しながら自動で運転できる自動車などでの活用～：北岡教英教授
（４）画像処理～身近な現場での実用化の具体例を紹介～：寺田賢治教授
（５）AIを活用したシステムのデモンストレーション：徳島大学大学院生の皆さん

（１）AI技術を用いたマルチメディアシステム

獅々堀正幹教授
徳島大学学院で博士号を取得。自然言語処理のエキスパートとしてジャストシステムやApple Japanとも共同研究を経験。
徳島大学獅々堀研究室では、「マルチメディア検索システム」の研究に取り組んでいます。例えば楽曲を素材にした研究では自動作曲やサビ部分の自動検出技術、テレビ映像を素材にした研究では特定の芸能人の自動抽出やチャプター作成技術の研究などが進んでいます。

この講義ではディープラーニングを用いた画像処理、画像検索、画像分類についてお話を頂きました。

AIの分類

一言で「AI」と言いますが、まず大きく2つに分けられるそうです。
一つは「強いAI」です。人間の脳に迫るような幅広い知識や意思を持つAIです。鉄腕アトムやドラえもんがこちらの代表格です。難しい表現だと「汎用人工知能」とも言います。

もう一つは「弱いAI」。画像認識や車の自動運転など、特定の用途に利用されるAIで、いま実現可能になっているものです。難しい言い方だと「特化型人工知能」とも言います。

AIについての話題が出ると、決まって「いつか人間の能力をAIが超え自我を持ち、自分たちより劣った人類を支配するのではないか？」という議論が起こります。この議論で登場してくるのは、「強いAI」の方です。強いAIは心を持ち、自分の意思でアクションを起こします。進化すれば、人間が制御できなくなる可能性もでてくるかもしれません。
ただし、現在は「強いAI」は実現されていませんので、その心配はないと言われているそうです。

それに対し、今世の中で盛り上がっているのは「弱いAI」とのことです。こちらは特定の分野で人間を超える能力を持ち、自分の意思を持つことはありません。様々なAIが開発し、業務効率化や人々の生活を豊かにする場面で活用されています。

AIの処理手法

AIには「エキスパートシステム」と「機械学習」という処理手法などがあるそうです。
エキスパートシステムは、その分野のエキスパート＝専門家が、処理の仕方をコンピュータに教える（プログラミングする）ものです。
「このような質問にはこう答える」とマニュアルを作っておいて、それに基づいて答えるようなチャットボットが分かりやすい例と思います。
徳島県でも阿波おどりのシーズンに、観光関連の質問に答える「阿波おどりAIコンシェルジュ」が活躍しました。これもエキスパートシステムで構築されていました。

「機械学習」は現在のAIブームのメインになっている手法です。大量のデータをもとに、コンピュータが自ら学習して、人間ではなかなか見つけられないパターンを見つけ出して処理する、というものです。
「パターンを見つけられるだけの、大量のデータを用意できるか？」というのが、機械学習でのポイントとのこと。少なくとも数百万のデータが必要だそうです。この膨大なデータを収集できるようになったことで、機械学習によるAIが飛躍的に発展しました。

さらにディープなお話し

ニューラルネットワークとは？

この機械学習の中もいろいろ分野があるそうで、「ニューラルネットワーク」もこの中の一つです。「ニューラルネットワーク」は今回の講座で何度も出てきました。重要なポイントだと思うので、少し細かく説明します。

ニューラルネットワークは、人間の脳の中にあるニューロン（神経細胞）のつながりや仕組みを数式的なモデルに表現したものです。

このニューラルネットワークは「入力層」「出力層」と、その間にある「隠れ層」から構成され、層と層の間には、ニューロン同士のつながりの強さを示す重み「W」があります。
この重み「W」を次の層へ伝搬したいか、したくないか、のさじ加減を調整していき、正しい回答（出力）が得られるようにしていきます。
そして、結果の間違いや誤差をもとに、さらに重みのパラメータを調整・更新して、処理の精度を高めていきます。

このニューラルネットワークで、隠れ層が多くあって層が深くなっているものを「深層学習/ディープラーニング」というそうです。ニューラルネットワークを多層にすることで、データに含まれる特徴をより深く学習することができます。

複雑になってきたので。ここで関係性を表すと・・

機械学習　＞　ニューラルネットワーク　＞　深層学習/ディープラーニング

となります。

このあと講義は、さらにディープラーニングの火付け役となった機械学習の手法「畳み込みニューラルネットワーク（Convolutional Neural Network＝CNN）」の説明などへと進みました。
また、画像からの物体検出や、顔の認識など、実際の研究事例も説明があり、AI手法がどのように使われているか、理解を深めることができました。

（２）自然言語処理～曖昧な日本語をコンピュータに理解させる技術～

泓田 正雄　教授
徳島大学で博士号を取得、2016年より同大教授となりました。
自然言語処理領域のＡＩを開発している株式会社言語理解研究所の役員でもあります。
同社は、ＮＬＰ（自然言語処理）を専門分野とし、さらにそれを発展させたＮＬＵ（自然言語理解）という先端技術での商品・サービスを提供しています。
泓田教授は、同社の研究者の中心となり研究開発に取り組んでいます。

言語の分類

まず、「言語には2種類ある」とのお話から始まりました。
一つは「人工言語」。コンピュータの入力に使われる、いわゆるプログラミング言語です。もう一つは「自然言語」。私達が話や文章で普段使っている言語です。
こちらの自然言語をコンピュータに処理させることを「自然言語処理」と言います。
かな漢字変換システムや、Google翻訳等の機械翻訳、iphoneのSiriのような対話システムなど、多くの分野で利用されているとのことです。

自然言語処理の流れ

自然言語処理は以下のような流れで行われます。

「形態素解析」文章を意味を持つ最小の単位まで、分割します。
↓
「構文解析」分割された単語の関係性を解析します。
↓
「意味解析」「文脈解析」で、文章の持つ意味を正しく理解していきます。

文章の順序が決まっている英語などに比べて、順番も頻繁に変わり、曖昧な日本語の文章をコンピュータに正しく理解させるのは、とても難しいそうです。

言語処理で活用される様々なソフトウェア

「形態素解析」や「構文解析」などのそれぞれの処理の中で、無料で利用できる様々なソフトウェアがあります。これらのソフトは大学の研究室などが開発し、誰もが使えるよう公開しているのだそうです。

さらにディープなお話し

例えば、形態素解析ソフトウェアにはMeCabやJUMAN++などがあるそうです。
構文解析では、KNP (日本語構文・格・照応解析システム)、CaboChaなど、有名なものがあるようです。
そのほかに、Wordnet、Word2vec、Gensimなどのキーワードが出てきました。
きっと自然言語処理に携わっている方にとっては、親しみのあるものなのでしょうね。

それらの一つ一つがどのようなものか？までは理解することができませんでしたが、これらが自然言語処理の発展に大きな貢献をしているということは分かりました。
多くの人が自分の研究を広くシェアすることで、私達は便利なシステムを使うことができているんだということを実感できる講義でした。

（３）音声処理～対話しながら自動で運転できる自動車などでの活用～

北岡 教英　教授
京都大学大学院工学研究科情報工学専攻を終了した後、デンソーに入社。社会人として勤務しながら博士号を取得しました。その後豊橋技術大学講師、名古屋大学准教授を経て2014年より徳島大学教授。

音声処理については北岡先生より講義が行われました。

「音声処理」で今最もイメージしやすいものはGoogle HomeやAmazon EchoなどのAIスピーカーだと思います。AIスピーカーは、人の声を聞き取って（音声認識）、答えを考えて（対話制御）、人の声で返す（音声合成）、という各種の音声処理を行っています。

この音声処理は自動車のカーナビゲーションシステムで発展してきたそうです。ハードウェアで音声処理をしていたのが1994～2001年頃。その後CPUが高性能化しソフトで実現できるようになりました。
（北岡先生もこの頃デンソーで製品開発していたという経歴をお持ちだそうです。）音声処理はさらに現在「クラウド型」へと進んでいます。カーナビでもGoogleの音声認識を利用したものも出てきています。

音声認識の活用例として：北岡先生の研究内容

徳島大学の北岡先生の研究室では、音声と顔認識で自動車を操作できる運転システム「マルチモーダル対話型自動運転」を名古屋大学、アイシン精機と共同開発しました。

こちらの研究では、下記のような機能が実現されています。
－目的地を言うと、車がその目的地へ向け、自動発信します。
－「減速して」や「速度を戻して」などの指示で、車が速度を変更します。
－「右に曲がって」などの指示で、車が進路の変更を行います。
－視線を向けて「あれはなに？」と問いかけると、顔認識やマップ情報から「図書館です」などと建物名を答えます。
－「あそこに停めて」と指示すると、視線の方向に自動的に車を留めます。

公開ツールの活用について

北岡先生からも「公開されている色々なツールが使えるのがポイント」とのお話がありました。公開されているソフトウェアやAPIを利用すれば、音声対話システムなどが簡単に作れるそうです。ただし「いろいろなフリーソフトがある。しかし、利用するのはなかなか難しい」ともお話されていました。そこで解決策の一つをご紹介します。

徳島県に本社を置く株式会社Harmonized Interactionsは、音声認識や音声対話システムなどの構築に関するコンサルティングを行っています。こちらの代表を務められているのが、北岡先生ご自身です。フリーソフトやGoogle社などの音声認識APIを利用した開発経験があり、独自開発の音声対話システムなども持っています。設計・構築のコンサルティングから、実際のシステム構築の受託まで、依頼内容に応じて幅広く対応が可能です。
音声認識・音声対話技術を活用した製品やサービスを検討したい企業の皆様は、ご相談してみてはいかがでしょうか？

さらにディープなお話し

音声認識の技術の変遷

音声認識の技術についての詳しいお話もありました。
かつての音声認識では「スペクトル分析」を中心としていました。これは、「音の各周波数成分の強さを並べたグラフを、人間が見て考えルールを作る」というものです。第一世代から第二世代のアプローチだそうです。
また、「隠れマルコフモデル（Hidden Markov Model）」という確率モデルが音声認識でも利用され、とても有効だったそうです。

ここに深層ニューラルネットワーク（DNN：Deep. Neural Network）によるディープラーニングで転換期が訪れました。DNNが自ら特徴を見つけてくれるようになり、音声認識が一気に高性能化しました。
今やすべてDNNになろうという時代であり、音声処理の最初から最後まで（End to End）、DNNで行われているとのこと。これが今進んでいる流れだそうです。

獅々堀先生のご説明されたニューラルネットワークのお話がここで結びつきました。やはり、ディープラーニングや機械学習は画期的な技術革新なのですね。

（４）画像処理～身近な現場での実用化の具体例を紹介～

寺田賢治教授
慶應義塾大学大学院にて博士号を取得（理工学研究科電気工学専攻）、2009年より徳島大学教授となりました。また、2020卒3月に卒業又は修了する学生の就職担当教員でもあり、徳島大学副理事として大学運営にも参加しています。

最後に、寺田先生より「画像処理」の講義が行われました。
寺田先生の研究室では一般的なアルゴリズムでは検出が難しい処理に積極的に取り組み、研究成果をあげています。そのため、商品の実用化を目指す企業からの特殊な研究依頼も多く、例年多くの企業と共同研究を行っています。

AIによる画像処理技術の産業応用

寺田先生からは画像処理に関する多くの事例をご説明いただきました。
今は画像処理がさまざまな身近なところで利用されているそうです。これには、ハードウェア、ネットワーク、カメラなどの進化が大きく貢献しています。

例えば、道路の監視などに、AIによる画像処理技術が使用されています。
道路や交差点に設置されたカメラの画像をもとに、車や横断車の量を見て、信号の制御を行うこと等に使われています。

また、画像処理技術は防災にも利用されています。設置されたカメラの画像から煙を感知し、火災を防ぐことができます。人の目でも分かりにくい微妙な煙も検出できるということで、様々な場所での活用が期待されています。

防犯での利用では不審者検知システムがあります。犯罪者が入ったあとではなく、防犯カメラの画像から怪しい動きを識別し、不審者が建物などに入る前に対処することができます。

このように様々な場面で利用されている画像処理技術ですが、産業利用には「一つのアルゴリズムでどんな場所でも使え、動くことが必要」だそうです。
様々なことが起こりうる実際の「現場」で確実に活用されるには、現実を見据えたシンプルさが大切ということなのだと思いました。
寺田先生は、商品の実用化に向けた企業からの依頼が多いとのこと。
とてもリアルな現在のAI活用の姿を理解することができる講義でした。

（５）AIを活用したシステムのデモンストレーション

今回の会場内では徳島大学院生によるAI技術を体験できる実機デモが行われました。

徳島大学大学院生によるデモ

今回展示されていたのは約10種類のAI活用システムでした。
例えばカメラからの画像を解析し、リアルタイムに「写っているものがなにか？」を自動判別するシステム。実際に自分の顔やペットボトルを写してみながら、正確に判別できることを実感しました。
その他にも、テレビの録画動画からお目当ての芸人の登場場面だけ見ることができるシステムは、顔認識の技術を使っているそうです。また、楽器の音も混じったバンドの音楽から、ボーカルの声だけを抜き出すシステムなどもあり、とても興味深く体験することができました。
徳大大学院生の皆さんの親切で分かりやすい説明もあり、楽しいひと時となりました。

説明してくれた徳島大学大学院生

ちなみに、皆さんの就職状況も聞かせて頂きました。
「県外への就職が決まっている」「情報系の大手から内定をもらっている」という方もいれば、「大学院の専攻を活かして中堅ベンチャーの研究開発職が決まっている」という方もいました。
徳島では企業との出会いが少ないためか、徳島で就職する学生が少ないことが分かりました。ITスキルを活かしたい人材と、徳島のIT企業とのマッチングに向け、Turn Up 徳島はさらに頑張っていきたいと思います。

今回のAI講座全体を通して

音声処理や言語処理など、それぞれの分野を専門とする先生から、技術的なお話や活用例を聞かせて頂き、大変勉強になりました。
また、徳島でAIの研究が非常に進んでいることも分かりました。

徳島からAIの研究が進み、新たなAI技術のサービスを日本全国へ、そして世界へ発信できる日を楽しみにしています。

【2/15・16参加者募集！】「とくしま…前の記事

【3月28日（木）開催】徳島デザインフォ…次の記事

徳島県へのIT転職支援プロジェクト