東京工業大学遠藤研究室では、高性能計算のためのソフトウェアの研究を、 TSUBAME3.0スパコンなどを用い行っています。 研究成果の一部は実際にTSUBAMEの設計・運用にもフィードバックされます。 最近はGPUを用いたディープラーニングの大規模化・高速化の研究も行っています。

配属については、情報理工学院 数理・計算科学系から志望することができます。

大学院入試スケジュールに関しては大学の入試情報ページ(修士)などを参照ください。

松宮遼君博士号取得

  • 投稿日:
  • by

博士課程の松宮遼君が博士号を取得(遠藤研初)しました。

  • 松宮遼:Integration of Non-volatile Memory into One-sided Communication for Extreme Big Data Applications

エクサスケール時代に向け超ビッグデータ応用の実現支援が重要となるなか、DRAMと不揮発メモリ(NVM, ここでは主にFlash)等からなるメモリ階層を持つ計算機、それらを多数持つ大規模システムにおけるプログラミングシステムの研究を行いました。ComEX-PMとvGASNetの提案・研究・開発により、片方向通信とNVMの利用を効率的に可能とします。特にvGASNetでは協調キャッシュの導入により、片方向通信の欠点の一つであるスケーラビリティの問題を大幅に改善しました。

2019-01-10 10.58.44t.jpg2019年1月10日に公聴会が行われ、その後の審査等を経て学位授与が決定しました。

在学中の研究内容の一部にはJST-CRESTおよび産総研・東工大RWBC-OILの文脈によるものが含まれます。

修士論文発表

  • 投稿日:
  • by

2019年1月31日~2月1日に数理・計算科学専攻の修士論文発表があり、伊藤君が発表しました。

  • 伊藤祐貴:GPUメモリ管理の実行時最適化による大規模深層学習の高速化

ニューラルネットワーク(NN)のモデルが複雑になる場合に、GPUメモリ容量が不足して学習ができなることがあります。そのような場合の解決のために、NNの構造全体を考慮する最適化技術PoocH(Profiline based out-of-core Hybrid method)およびChainerフレームワークの改造による実装・評価を行いました。

2019-01-31 18.23.18.jpg

研究内容にはIBM東京基礎研との共同研究の内容を含みます。

研究成果を https://github.com/yukiito2 にて公開中です。

遠藤研究室の今年度の研究室紹介を、下記の日時で開催します。

  • 第一回:2019/1/30(水) 15:05~16:35
  • 第二回:2019/2/5(火) 13:20~14:50

場所:西7号館302号室 (建物入口のすぐ左手)

出席希望者は、前もって endo[at]is.titech.ac.jp にメールもしくは、Twitter ToshioEndoに連絡もらえると助かりますが、予告なしでも大丈夫です。

時間の都合がつかないが話を聞いてみたい、という場合も上記に連絡ください。

遠藤研究室の今年度の研究室紹介を、下記の日時で開催します。

  • 第一回:2018/2/5(月) 13:20~14:50
  • 第二回:2018/2/6(火) 10:45~12:15

場所:西7号館203号室集合 → 会場へ (直接下記会場に来てokです)

  • 第一回:西7号館205号室
  • 第二回:西7号館302会議室

出席希望者は、前もって endo[at]is.titech.ac.jp にメールもしくは、Twitter ToshioEndoに連絡もらえると助かりますが、予告なしでの参加もお気軽にどうぞ。

どちらにも都合がつかないが話を聞いてみたい、という場合も上記に連絡ください。

SWoPP2017での発表

  • 投稿日:
  • by

並列/分散/協調処理に関する『秋田』サマー・ワークショップ (SWoPP2017)は7/26~28に秋田で行われ、当研究室からは4件のメモリCRESTプロジェクトに関する発表を行いました。

  • 松宮 遼,遠藤 敏夫. vGASNet: メモリ階層深化に向けたスケーラブルな低レイヤ通信ライブラリ

swopp17-matsumiya.jpg

  • 田邊 昇,遠藤 敏夫. Intel Xeon Phiにおける主記憶遅延増加の影響評価

swopp17-tanabe.jpg

  • 幸 朋矢,佐藤 幸紀,遠藤 敏夫. Polyhedralコンパイラを用いたタイリングパラメータ自動調整ツールのメニーコア環境での評価

swopp17-yuki.jpg

  • 伊藤 祐貴,松宮 遼,遠藤 敏夫. ooc_cuDNN: GPU計算機のメモリ階層を利用した大規模深層学習ライブラリの開発

swopp17-itou.jpg

卒論発表

  • 投稿日:
  • by

2017年2月9~10日に情報科学科の卒業論文発表会があり、当研究室からは伊藤君が発表しました。

  • 伊藤祐貴メモリ階層を利用した大規模深層学習手法と性能モデリング

Convolution Neural Networkの演算はGPGPUにより高速に行うことができる一方、計算のサイズについてはGPUのメモリ容量(数~十数GBで、ホストメモリより小さい)により限定されます。その容量を超えるようなサイズの計算が可能で、cuDNNライブラリと互換性を持つooc_cuDNNライブラリを開発中で、性能モデルによる最適化も行っています。

4月に虎ノ門で行われるxSIG会議での発表も決まっています。

2017-02-10 13.43.18.jpg

ESPM2 2016(SC併設)での発表

  • 投稿日:
  • by

2016年11月にSalt Lake Cityで行われたSupercomputing '16会議の併設ワークショップESPM2(International Workshop on Extreme Scale Programming Models and Middleware)で,博士一年の松宮遼君が発表を行いました.

Ryo Matsumiya, Toshio Endo: PGAS Communication Runtime for Extreme Large Data Computation

PGAS(partitioned global address space)システムであるGlobal Arraysを用いたアプリケーションに対して,実メモリ容量を超えるような実行(out-of-core実行)を透過的に実現するライブラリの設計・評価について発表しました.

ESPM2-16-matsumiya2.jpg

ESPM2-16-matsumiya1.jpg

なお,8月のSWoPP'16@松本でも発表を行っています.

SWoPP16-matsumiya.jpg

一期生修論発表

  • 投稿日:
  • by

遠藤研究室一期生の三人が2月に修士論文発表を行い、無事修士課程修了しました。おつかれさまでした。

 

  • 佐々木 尚人:時間発展アプリケーションにおけるチェックポイントデータの非可逆圧縮手法の提案と評価
2016sasaki-master.jpg
  • 辻田 裕紀:マルチGPU・マルチノード環境のメモリ階層に適応した数理最適化ソルバー向けスケジューリング手法
2016tsujita-master.jpg
  • 都筑 一希:CPU・GPU混載ノードにおける性能・消費電力モデルを用いたオンライン電力制御手法
2016tsuzuku-master.jpg

※発表会での写真がピンボケしてしまったため、後日の説明の様子

ESPM2(SC併設)での発表

  • 投稿日:
  • by

2015年11月に行われたSupercomputing '15会議の併設ワークショップESPM2 (International Workshop on Extreme Scale Programming Models and Middleware)にて、修士二年の辻田裕紀君が発表を行いました。

Yuki Tsujita, Toshio Endo, Katsuki Fujisawa: The Scalable Petascale Data-Driven Approach for the Cholesky Factorization with Multiple GPUs (slides)

九州大学藤澤克樹先生が中心に開発している数理問題最適化ソルバーSDPARAについて、数千基以上のGPUを使った際の性能をさらに向上させる改良を行いました。

コレスキー分解の計算部分を、データドリブン方式で行う・GPUとCPU間のデータ移動量を抑えた分散データ処理基盤を実装する・非同期ブロードキャスト相当の通信をスケーラブルに行うなどの工夫を行いました。これにより、TSUBAME2.5ほぼ全体の1360ノード・4080GPU上で1.775PFlopsを達成しました(世界記録更新!)

 

espm2-15-tsujita.jpg