ホーム > HPC・DL・AI > 導入事例 > HPC・Deep Learning・AI > 東京農工大学 田中 雄一

東京農工大学
田中 雄一

 第33回目のインタビューは、東京農工大学 工学研究院 先端情報科学部門 准教授の田中 雄一先生にお話をお伺いしました。
田中先生は、東京農工大学に着任された2012年より、グラフ信号処理の分野に携わり、その中でもソーシャルネットワークや脳波、自動運転に使用されているLiDAR(ライダー)のような点の集まりを統一して処理するための理論的な研究を行っています。

 ご研究を進める中で、それぞれの分野で経験的に行われていることが、実は基礎となる汎用的な理論の上にその分野特有の適用方法や応用の仕方があることに気づかれ、理論やテクニックを一般化させ、信号処理や機械学習の理論をうまく整備し、ツールボックスやライブラリを様々な分野で使えるよう応用の範囲を広げることに注力されています。

本日はどうぞよろしくお願いします。
早速ですが、田中先生の現在のご研究に至るまでの流れや、どんな研究に取り組まれているかをお話いただければと思います。

 私のメインの研究分野は信号処理です。今風にデータ解析と言えば通りがいいかもしれません。その中でも力を入れている領域はグラフ信号処理です。元々、私は学生のころからずっと画像処理をやっていました。音や画像というのはいわゆる、よくある信号処理や機械学習の対象です。それでドクターの学位も取り、農工大に来る前に宇都宮大で助教として研究教育を行っていました。
 農工大に来たのが2012年なので8年前です。農工大へ来て准教授になったので、自分で研究室が持てるようになりました。そのときに何か新しいことを始めようと、どうしようかなといろいろ探していたのですが、画像処理をしている人はたくさんいるので、今までの延長で画像処理をしていると、どうしても研究者あるいは研究室として、他の人と同じように見えてしまいます。
 そこで始めたのが、グラフ信号処理といわれる分野で、ここ10年ぐらい、世界的にはやっているトピックです。画像などもグラフ信号処理を使って処理できますが、どちらかというと画像などの今までよく扱われているデータではなくて、ソーシャルネットワークや脳のデータ(脳波)だったり、自動運転に使っているLiDAR(ライダー)のような点の集まりだったりを統一して処理するための、どちらかというと理論的な研究をしています。
 画像などと違って何が難しいか、何が面白いかというと、ソーシャルネットワークは人同士がつながっていて、リンク――フォローやフォロワーの関係があり、情報の拡散の仕方が人によって違います。例えばInstagramにジャスティン・ビーバーが何かをポストすると、一気に広がります。また、クリスティアーノ・ロナウドが何か写真をアップロードすれば広がりますが、一方で、普通の大学生がポストしても全然広がりません。つまり、情報やデータの広がり方が人と人とのつながりなどによって、いろいろ変わります。同じような例は脳内の情報の伝わり方などでも見られます。グラフ信号処理で面白いのは、何かよく分からない、ぐちゃぐちゃとしていてきれいに並んでいないデータが実はきれいな理論体系でうまく解析できるからです。
 グラフ信号処理は私が最初に始めたというわけではありません。はしりの論文が2011年ぐらいですから、農工大に来る直前ぐらいに出版されました。
 その前からずっと新しいテーマを探していて、トライアンドエラーを繰り返していましたが、このグラフ信号処理に関しては、結構うまく当たりました。今までの画像処理で得られた知識や知見を拡張することで、上に挙げたようないろいろなデータでも信号処理のフレームワークで扱えます。そうすると、例えば画像処理で使われていた方法が、脳波の処理に使えるかもしれない。ソーシャルネットワークのデータを処理する方法は実は電力網の解析で使われていた方法と理論的に同じかもしれない。グラフ信号処理を用いることで、様々な研究分野の同じような研究が理論的に統一して扱えたら面白いですよね。なので、ここ7年ぐらいはグラフ信号処理をメインにやっています。

ありがとうございます。ご研究にあたり、何か特定の応用(アプリ)があるのでしょうか?

 それはすごくいい質問です。結構いろいろなアプリを探しながらやっています。理論的にはできるというのと、面白い応用、興味深い応用のようなものを見つけるというのはまだ別のフェーズの話です。グラフ信号処理は汎用的な手法ですので、ある意味何にでも使えますが、それぞれの分野にそれぞれのスペシャリストがいらっしゃいます。私は脳波を計測できないし、ソーシャルネットワークのデータを集められるわけではないので、いろいろな人と協力してやる必要があります。
最近は新型コロナウイルスのデータ解析にもいろいろと使えそうかなと思っています。データ自体はすごくたくさんありますので、海外の研究者と共同研究をしています。
 また、このような複雑なデータを解析するという話は機械学習でもはやっています。例えば自動運転で扱うデータでは、点の集まりが人や車だったりします。このようなデータから物体認識をするには、画像ではなく、点の集まりが車です、人ですということを認識する必要があります。このようなタスクに用いる機械学習技術のためにグラフ信号処理やグラフニューラルネットの研究が盛んに行われています。
画像や音というと直感的なアプリがあります。今までは理論的な整備をずっとしていたのですが、大体できること、できないことが大雑把に分かってきたので、ここ1~2年くらいはグラフ信号処理が利用できる面白いキラーアプリがないか、学生と一緒に探しながらやっているという感じです。

グラフ信号処理は学生のころからではなくて、ここ数年のご研究ですか?

 そうですね、元々グラフ信号処理という分野がありませんでした。ここ10年もないぐらいで分野ができて、一気に皆がやるようになりました。信号処理としては結構ホットなトピックです。また、機械学習の分野の研究者もグラフ上の機械学習のようなものに興味を持っています。ディープラーニングの流行もあって、今はグラフ上の信号処理と機械学習の両方がブームのようになっています。

お話を聞いていますと、そのご研究が多方面に応用が利くような印象ですね。

 今までは、例えば電力網だと電力システムの研究者がやっており、自動運転はそれ専門の研究者、脳波だと医師やブレイン・コンピュータ・インターフェースなどをやっている専門の研究者、画像処理は画像処理の研究者がいて・・・というように、要するに当たり前ですが、ある分野の研究者はその分野のことに興味があるので、分野内で知見が閉じているように思います。ある分野ではとても良い方法や、その分野用にできているすごい分析手法があっても、他の分野の研究者が見えるようにはなかなかなっていません。そこで、理論やテクニックをもう少し一般化し、理論的に考えてあげると、実は脳波の解析でやっていることと画像処理でやっていることは本質的には同じだったということがよくあります。つまり、それぞれの分野で経験的にやられていたことというのが、実は基礎となる汎用的な理論の上にその分野特有の適用の仕方や応用の仕方がある、と捉えることができます。
 個人的には、実は色々な分野の研究者が同じようなことをやっている気がします。つまり、結局やりたいことという「頂上」は1つしかないけれども、みんな別の登山口から登っていて、他の登山口で山登りをしている他の人――他の分野の研究者――がどこにいて、何をしているかは分からないというようなことが起こっている気がします。
信号処理や機械学習は、数学や物理の理論的なところと、実社会の問題を解決する工学の間ぐらいに位置づけされていると私は考えているので、うまく理論を整備して、ツールボックスやライブラリをいろいろなところに使えるようにしてあげることで、いろいろな分野の人がちょっとグラフ信号処理を使ってみようかなという風になると面白いかなと思っています。
 ただ一方で、色々な分野の人たちに見つけてもらうのを待っているだけだとなかなか応用が広がらないので、こちらとしても理論的なベースはありつつ、「このような応用があります」と言う必要がありますので、現在試行錯誤中です。
 直接的な応用の例で言うと、どこにタクシーを配車すると一番良いかというような話にもグラフ信号処理を使える可能性があります。
あとはIoT関係ですね。IoTのセンサーを使って、例えば工場全体の気温や気圧を測りたい場合を考えます。実際にはセンサーを置ける場所やセンサーの数が限られている場合がたくさんあります。例えばセンサーが10個あったとして、どこに置くと一番うまく空間全体をセンシングできますかというような話にもグラフ信号処理を使うことができます。

他分野に適用するというのは、例えばいろいろな分野の学会に行き聴講するということもされているのですか?

 意外と他分野への応用は共同研究から始まることが多いです。たまたま知り合いの先生の知り合いというような人から声が掛かり、ディスカッションを通じて「こういうことができるんじゃない?」ということで始まったりします。
  
逆に、他分野の学会へ行っても、当たり前ですが発表が専門的なので、解説してくれる方がいないと隣の分野でも全然分からないというようなことが結構あります。
 実際に科学や医学、産業側で問題を解決しようとしている人は、色々なセンサーを使ってセンシングしています。センシングしているとデータはたくさん集まりますが、逆にそれを解析する際にはツールボックスやライブラリの既存コードを使うことが多いです。
 信号処理や機械学習などのデータ解析の最新の手法を使うと、既存コードのいわゆる「枯れた」手法と比べてより高速・高性能に解析できる可能性があります。データを集めている人、あるいはデータを持っているけれども、そのデータをどう解析したらいいか分からない人たちがたくさんいるので、センシングする側とデータ解析側がうまくコラボレーションできるようになって、山のようにあるデータを汎用的なデータ解析技術に分野特有の知見を加えて、データに含まれる新たな知識や発見を共同研究で見つけられるといいかなと思っています。

共同研究から産業に応用されたり、実際に企業と共同研究を進めたりすることもありますか?

 はい。現在色々な企業と共同研究をしています。企業と共同研究をやると言っても、企業によってスタンスが違います。完全に開発寄りなのか、研究寄りなのかという話で、現状はどちらかと言えば研究寄りで、グラフ信号処理ないしグラフニューラルネットのようなツールを使って、何か面白いことをできればいいかな、という感じで研究を進めさせていただいています。
 企業と共同研究をやると、色々な種類のデータをたくさん持っていますので「他にもこういうデータが取れる」とか、「こういうデータをこのツールで解析したらどうだろう」と言われることが多いので、楽しく共同研究をやらせてもらっています。将来的に・・・例えば5年後に製品として何か出るかというとちょっと分かりませんが、色々な企業と共同研究を進めて、楽しくコラボレーションできるといいかなという感じでやっています。

先生の研究室のホームページを拝見した際、2019年から深層学習に関する科研費「挑戦的研究(萌芽)」に採択されておられますが、
お話を聞いていると、もうだいぶ前からデータ解析など、やはり大量のデータ処理でGPUの計算機を使われている印象ですが、深層学習はまたそれの延長上でやっているイメージでしょうか?

 そうですね。科研費のものはグラフニューラルネット、機械学習寄りのほうで採択してもらいました。私の個人的な認識では、信号処理と機械学習はお隣同士の研究分野です。どちらかと言えば、信号処理は結構センサー寄りといいますか、実際にデータを取るところと、そのデータを解析のためにきれいにしたり圧縮したりするような研究分野です。
 機械学習というのは、そのきれいにしたデータを計算機で解析する分野です。料理の例えで言うと、信号処理も機械学習も、鍋や包丁を作っているような感じだと捉えるのがわかりやすいかもしれません。鍋や包丁は基本的な形は大体同じですが、料理に応じて適切な大きさや形があります。信号処理や機械学習も、汎用的な解析技術を応用に応じて適切に変更や改良する必要があります。
 信号処理と機械学習は分野として隣り合っていますが、機械学習の人が知らないこともあるし、信号処理の人が知らないこともあります。信号処理の知見をうまく使って、例えばディープラーニングのアーキテクチャに入れ込んであげると、学習が速くなったり、性能が良くなったりするのではないかなと思って、いろいろ試行錯誤をしている感じです。
 科研費の話に戻ると、深層学習に関する研究はニューラルネットを学習するのに、高性能なGPUがないとどうしようもない面があります。良いアイデアがあっても、実現できないとどうしようもないのでHPCシステムズさんにお願いをしました。以前はGPUマシンではなくて、CPUのサーバーを買っていましたが、最近はもうGPUのワークステーションばかりになっています。
 研究室配属前の学部生に聞くと、やはり皆機械学習…というか特に深層学習をやりたいようです。実際には機械学習という研究分野はすごく幅広いのですが。3年生くらいになって色々な講義や実験を経験すると、ある意味幻想が薄れてきて、「何かもっといろいろなことをやりたい」となっていく傾向があります。
 最近農工大工学部は学科を改組して、私が所属する学科は「知能情報システム工学科」という名前になりました。大学の学科の構成が変わったので、入ってくる学生も結構変わりました。今までも多かったのですが、今は本当に人工知能がやりたい学生が多いです。エンジニア系の職だと、今は特に人工知能、特に深層学習系のスキルを持っている人が求められています。ただ、将来的に現在と同じ状況は続かないと思っています。なので、学科としては情報工学と電気電子工学の双方に軸足を置いて教育しています。

ありがとうございます。コロナウイルスに関するデータの解析にも使えそうかなというお話が先程少し出ましたが、非常に興味深いです。
どのようなデータを解析されていらっしゃるのですか?

 基本的には公開データです。倫理的な問題をクリアするために、公開データしか基本的に使いません。各国が毎日、陽性者数と回復者数、死亡者数などのデータを報告しています。これは、ある意味非常に大規模な社会実験を現在やっている状態です。昔と違ってこのような疫学的なデータが全部集められるようになってきたので、未知のウイルスに対して人類がどう対応したかという記録が今、全部残っています。
このようなデータは今までにほとんどありません。しかも今のところ対策に絶対の正解がありません。現状、ワクチンがない以上、日本の政策が正しいかどうかもまだ分からず、アメリカの政策が正しいかも分からず、イタリアの政策が正しいかも分からないのですが、全ての国で共通しているのが、どうにかして感染を押さえ込みながら人間の活動は維持していくということです。
 今、全世界で第2波・第3波の感染爆発が起こっています。単純に考えればロックダウンで移動制限し、電車も全部動かなくしてしまえば多分一番早く収まります。しかし、実際には人の移動を完全に制限するのは難しいと思っています。
 そこで、地域ごとの感染者の広がり方が国によってどう違っていたのか、あるいはロックダウンが始まる前と、ロックダウン中と、ロックダウン後でどのように違うのかということを解析し、どのようにうまく移動制限をすると、どれぐらい感染が収まるのか・・・というのを解析してみたいと思っています。
 例えば日本もイタリアも移動制限を行っていましたが、法的拘束力が全然違います。例えば外出制限にしてもいろいろな国がいろいろなレベルの外出制限をしていますが、それは実際には目的をどう定量化して行っているのか、ということは、たぶん誰も知りません。
実際に外出制限をする判断をする政治家が定量化した目的を持っているわけでもなく、どこをどのようにロックダウンしたらいいかというのを誰も知らない場合、ある意味場当たり的に決めるしかありません。このコロナ禍がいつまで続くのかが分からないという状況なので、データとしては解析する価値があると思っています。

そうですね。研究者にとってもかなり注目されているデータだと思います。

 皆が注目しているデータを、こんなに詳細に世界中で集めているということが、まずないことです。すごく詳細なデータがそろっているので、データ解析をする側としてはやりがいがあるかなと思っています。
 学生も興味を持っており、何人かがやっています。ただ、データがたくさんあるとは言っても国や自治体によってデータ形式が全然違うことがあります。例えばヨーロッパのある1カ国だけだったらうまく解析できるデータが、地続きのヨーロッパ全体のデータを使って解析しようとしたときには、かなり手間を掛けてうまく整形しないと使えるようなデータにならないということもあります。

今までシミュレーションでしか行えなかったことと、実際のリアルのデータが出た上で比べてみて、結果に差はありますか?想定と全く違っていたことなどもございますか?

 コロナウイルスの感染しやすさなどの統計的な性質が、どうしても解析には必要なのですが、その辺りのデータがまだうまくそろっていないのかなという感じはします。
 例えば、原理的には社会ネットワーク上でうわさが広まるモデルと感染症が広がるモデルは結構近いところもあります。一方で、実際に制御できるかどうかというのは、また別の話です。さらに、全体としての動向ではなく、ローカルなネットワーク上でデータがどう変わっていくかというのはもう少し難しい問題になっていると思います。
 データをフィッティングするのはそれなりにできますが、やはり将来の予測というのは非常に難しいです。特に今は、誰もが第2波が起こるとは思っていたけれども、結局何が主な原因なのかがよく分かっていないと思います。感染者数の増え方も国によって全然違うけれども、その違う原因がどこにあるのかなどの、分からないことが、やはりまだ結構あります。だから、その辺りの知見がうまくアップデートされていくと、どんどん予測のモデル、あるいは推定のモデルの精度が上がっていいき、本当に役に立つようなモデルになるのではないかと思いますし、そうしたいと、解析をやっている皆が思っています。

やはり知りたいですね。ウイルスの種類が違うのか、もしくは持っている何か抗体が違うのか分からないですけれども、こんなに桁数が変わると何だろう?と思いますね。

 感染症の専門家はミクロ的にどうなっているかを研究していると思いますが、その辺りで何かいろいろ分かっていくことがあると、感染拡大モデルにも反映できるので私達も知りたいと思っています。

いろいろお話を聞かせていただきありがとうございます。
さて、話は少し変わりますが、農工大にご就任されてからずっと当社の計算機を定期的にご購入いただいており、最新だと3月ごろにGPUマシンをご購入いただいておりますが、これまで導入された計算機と今回の計算機も含め、フル稼働でお使いになっていらっしゃるのでしょうか?

 以前購入したものはCPUのサーバーなので、今はそこまで動いていません。今、やはりメインで動いているのはGPUのワークステーションです。
 今はやっと一段落しましたが、国際会議前だとフル稼働です。その際、静音ラックに入れてありますが、音が非常に大きいのと、電気代は払わなくて良いものの、電力消費量もフルで動かすと大変ですね。

田中先生の研究室の学生さんは何名いらっしゃいますか?

 今は12人です。ただ、深層学習などのGPUを使って主に研究をやっている学生は5人ぐらいですね。サーバーにするか、ワークステーションにするか、いろいろ考えて結構迷っていましたが、1人1台を使えるのならばワークステーションのほうが取り回しが利きやすいので、ワークステーションでいいかという感じで使っていました。
 ただ、学生部屋の電源容量がぎりぎりで、同じコンセントの同じ系統に電子レンジがたまたまつながっていて、私が電子レンジを使ったら学生が回していた計算が落ちてしまって(笑)。

電源容量のお話を聞きますと、現状は、必要でも気軽に買い足すことができない状態でしょうか?

 基本的に性能は高ければ高いほど解析の効率があがるので、例えば台数が足りていたとしても、1世代前、2世代前のGPUだと、効率が落ちます。あとは、いろいろなニューラルネットワークのアーキテクチャ、いろいろなディープのモデルを考えてあげて、何回トライできるかも大事です。これは駄目、これは駄目、これは駄目といって、当たりが見つかるまで探す作業がかなりあります。しかも同じネットワーク構造でもハイパーパラメータによって何回も回す必要があるので、性能は高ければ高いほど良いということになるのです。
 だから学生にはできるだけ最新のものをそろえてあげて、こちらとしては計算速度がボトルネックにならないようにしてあげたいです。トライできなくて、あまり性能がでませんでしたということはできるだけ避けたいし、論文の〆締め切りもありますので、数としては足りていても、できるだけ新しいもの、速いものにしたいというのは常に思っています。
 前期は大学が閉まっていて学生も来られなかったので、計算機を買っても使う人がいないとどうしようもないと思っていました。ようやく来られるようになり、電源工事もそろそろ考えなければいけないと考えています。

先程音のお話が出ましたが、その他に、当社の計算機に関するご意見などございますか?

 そうですね、実は他の業者からも1台、2台くらい買ってみましたが、設定などをきちんとやってくれなくてそのまま納品されて終わりです。あまり値段が変わらないのに、HPCシステムズさんはきちんと来て、きちんと設定してくれますね。基本的な設定が整っていると、新しいマシンを買ってもGPUが基本的には違うだけなので、移行はしやすいです。非常に助かっています。

それはとても当社にとっては嬉しいお話ですね。ありがとうございます!
では最後となりますが、今後やりたいことや展望などございましたら、ぜひお聞かせいただければと思います。

 やはり信号処理は縁の下の力持ちです。データを持っていてその解析をしたい人はたくさんいますが、データを取る人が必ずしもデータ解析のプロなわけではありません。そういう意味だと信号処理や機械学習はやはり汎用的・理論的なところが得意なので、その辺りの研究を進めていきたいと考えています。
 一方で、信号処理がもっと理論的になると数学や物理があります。信号処理研究者としては、数学と工学・産業の間をうまくつないであげることが大事だと考えています。その上で最新の知見、理論的な知識、あるいは進展を、できるだけ早くアウトプットに持っていきたいと思って研究を進めています。
 そのためにはデータ解析の応用と理論の両方をキャッチアップしないといけないので大変ですが、そこをうまくできると、最新の理論や最新のアルゴリズムが、データを持っている側から見て使いやすい形でブラックボックス化できるようになると思います。我々の最新の研究成果を早く出口のほうまで伝えていけるようになれたらいいなと思っています。

本日は大変興味深いたくさんのお話をお聞かせいただき、ありがとうございました。
今後ともどうぞよろしくお願いいたします。

■ 研究室に設置されている計算機

田中 雄一 先生のプロフィール

  • キャンペーン情報
    現在開催されているお得なキャンペーン情報はこちらから。
    詳細
  • ご購入前のお問合せ
    フォームにご入力いただければ後ほど営業よりご連絡させていただきます。
    詳細
  • 見積り依頼
    フォームにご入力いただければ後ほど営業よりご連絡させていただきます。
    詳細
Contact

お問い合わせ

お客様に最適な製品をご提案いたします。まずは気軽にお問い合わせ下さい。
03-5446-5531

平日9:30~17:30 (土曜日、日曜日、祝祭日、年末年始、夏期休暇は、休日とさせていただきます。)