Publication / 研究業績


FY2017

Refereed Papers

  • Yukinori Sato, Tomoya Yuki and Toshio Endo. ExanaDBT: A Dynamic Compilation System for Transparent Polyhedral Optimizations at Runtime. In Proceedings of ACM International Conference on Computing Frontiers 2017, 10pages, Siena, May 2017. (accepted)

    2017年度(日本語)

    学会発表(査読あり)

  • 伊藤祐貴,松宮遼,遠藤敏夫. メモリ階層の利用によってGPUメモリ容量を超える深層学習手法 . The 1st. cross-disciplinary Workshop on Computing Systems, Infrastructures, and Programming (xSIG 2017), 東京,2017年4月.

    ポスター発表

  • 伊藤祐貴,松宮遼,遠藤敏夫. メモリ階層の利用によってGPUメモリ容量を超える深層学習手法 . The 1st. cross-disciplinary Workshop on Computing Systems, Infrastructures, and Programming (xSIG 2017), ポスターセッション, 東京,2017年4月.
  • 松宮遼,遠藤敏夫. Flash SSD を活用する PGAS フレームワークに対する協調キャッシングの導入 . The 1st. cross-disciplinary Workshop on Computing Systems, Infrastructures, and Programming (xSIG 2017), ポスターセッション, 東京,2017年4月.

    FY2016

    Refereed Papers

  • Satoshi Imamura, Keitaro Oka, Yuichiro Yasui, Yuichi Inadomi, Katsuki Fujisawa, Toshio Endo, Koji Ueno, Keiichiro Fukazawa, Nozomi Hata, Yuta Kakibuka, Koji Inoue, Takatsugu Ono. Evaluating the Impacts of Code-Level Performance Tunings on Power Efficiency. In Proceedings of IEEE International Conference on Big Data (BigData 2016), 6pages, Dec 2016.
    [DOI: 10.1109/BigData.2016.7840624] [IEEE digital library]
  • Ryo Matsumiya, Toshio Endo. PGAS Communication Runtime for Extreme Large Data Computation. In Proceedings of Second International Workshop on Extreme Scale Programming Models and Middleware (ESPM2), in conjunction with IEEE/ACM SC16, 8pages, Saltlake City, November 18, 2016.
    [DOI: 10.1109/ESPM2.2016.007] [ACM digital library]
  • Toshio Endo. Realizing Out-of-Core Stencil Computations using Multi-Tier Memory Hierarchy on GPGPU Clusters . In Proceedings of IEEE Cluster Computing (CLUSTER2016), pp. 21-29, Taipei, Sep 2016.
    [DOI: 10.1109/CLUSTER.2016.61] [paper] [slides]
  • Katsuki Fujisawa, Toyotaro Suzumura, Hitoshi Sato, Koji Ueno, Yuichiro Yasui, Keita Iwabuchi, Toshio Endo. Advanced Computing & Optimization Infrastructure for Extremely Large-Scale Graphs on Post Peta-Scale Supercomputers. Fujisawa, Katsuki, Shinano, Yuji, and Waki, Hayato (eds.), Optimization in the Real World - Toward Solving Real-World Optimization Problems -, Series of Mathematics for Industry, Springer, pp. 1-13, 2016.
    [DOI:10.1007/978-4-431-55420-2_1]

    Invited Papers

  • Satoshi Matsuoka, Hideharu Amano, Kengo Nakajima, Koji Inoue, Tomohiro Kudoh, Naoya Maruyama, Kenjiro Taura, Takeshi Iwashita, Takahiro Katagiri, Toshihiro Hanawa, Toshio Endo. From FLOPS to BYTES: Disruptive Change in High-Performance Computing towards the Post-Moore Era . In proceedings of the ACM International Conference on Computing Frontiers (CF'16), pp. 274-281, May 2016.
    [DOI: 10.1145/2903150.2906830] [ACM digital library]

    Poster Presentations

  • Takashi Shimokawabe, Toshio Endo, Naoyuki Onodera, Takayuki Aoki. Performance Evaluation of Wind Simulation Based on a GPU-computing Framework to Realize Large-scale Stencil Computations Beyond Device Memory Capacity. The 7th AICS International Symposium, Poster session, Kobe, Feb 2017.

    Other Presentations

  • Toshio Endo. Operating Experience with SSD and GPUs. Accelerated Data and Computing (ADAC) Workshop, Lugano, June 2016.

    2016年度(日本語)

    無査読論文

  • 田邊 昇,遠藤 敏夫. 疎行列系アプリケーション性能の主記憶遅延増加の影響評価 . 情報処理学会研究報告, 2017-HPC-158 No.15, 2017年3月9日.
  • 本山 義史,遠藤 敏夫,松岡 聡,横田 理央,福田 圭祐,佐藤 育郎. 低ランク近似行列によるCNNにおける畳み込み演算の最適化 . 情報処理学会研究報告, 2017-HPC-158 No.25, 2017年3月9日.
  • 佐藤幸紀,幸朋矢,遠藤敏夫. 透過的メモリ階層チューニングのための動的バイナリ変換機構の設計と開発 . 情報処理学会研究報告, 2016-ARC-216 No.35, 2017年1月25日.
  • 田邊 昇,遠藤 敏夫. 中遅延大容量メモリ階層出現のインパクトと新たな対応に関する初期検討 . 情報処理学会研究報告, 2016-HPC-157 No.11, 2016年12月22日.
  • 黒田 勝汰,遠藤 敏夫,松岡 聡. ディレクティブによる時空間ブロッキングの自動適用 . 情報処理学会研究報告, 2016-HPC-157 No.18, 2016年12月22日.
  • 松宮 遼,遠藤 敏夫. Flash SSDを含む多階層メモリを活用するPGASランタイムシステム . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2016), 情報処理学会研究報告, 2016-HPC-155 No.31, 2016年8月9日.
  • 松岡 聡,天野 英晴,中島 研吾,井上 弘士, 工藤 知宏,丸山 直也,田浦 健次朗,岩下 武史, 片桐 孝洋,塙敏博,遠藤 敏夫. ポストムーア時代におけるFLOPSからBYTESへの変革 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2016), 情報処理学会研究報告, 2016-HPC-155 No.32, 2016年8月10日.
  • 佐藤 真平,佐藤 幸紀,遠藤 敏夫. ステンシル計算コードの性能とメモリレイアウトの関係性について . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2016), 情報処理学会研究報告, 2016-HPC-155 No.37, 2016年8月10日.
  • 下川辺 隆史,遠藤 敏夫,青木 尊之. GPUデバイスメモリを超える計算を可能とするためのステンシル計算フレームワークの拡張とその性能評価 . 日本計算工学会 第21回計算工学講演会, B-5-3, 新潟, 2016年6月1日.

    その他の発表

  • 遠藤敏夫. ポストペタスケール時代のメモリ階層の深化に対応するソフトウェア技術, 「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出」研究領域 平成28年度公開ワークショップ, 東京,2016年12月15日.
  • 遠藤敏夫. GDDR・DDR・Flashの多階層メモリを利用するランタイムライブラリと大規模ステンシルへの応用, 第2回メモリプラスワークショップ, 東京,2016年8月31日.
  • 遠藤敏夫. NVMe Flash SSD利用による 科学技術計算の 規模と演算速度の両立第7回ビッグデータ基盤研究会, 東京,2017年3月29日.

    FY2015

    Refereed Papers

  • Yukinori Sato, Toshio Endo. Dynamic Compilation for Transparent Data Locality Analysis and Memory Subsystem Tuning . The International Workshop on Architectural and Micro-Architectural Support for Dynamic Optimization (AMAS-DO), In conjunction with CGO 2016, Barcelona, March 13, 2016.
  • Shimpei Sato, Yukinori Sato, Toshio Endo. A Cache-aware Temporal Blocking Method for 3D Stencil Computation . 3rd International Workshop on High-Performance Stencil Computations (HiStencils 2016), In conjunction with HiPEAC 2016, Prague, January 18, 2016.
  • Toshio Endo, Yuki Takasaki, Satoshi Matsuoka. Realizing Extremely Large-Scale Stencil Applications on GPU Supercomputers . In Proceedings of The 21st IEEE International Conference on Parallel and Distributed Systems (ICPADS 2015), pp. 625-632, Melbourne, December, 2015.
    [DOI: 10.1109/ICPADS.2015.84] [IEEE digital library]
  • Yuki Tsujita, Toshio Endo, Katsuki Fujisawa. The Scalable Petascale Data-Driven Approach for the Cholesky Factorization with Multiple GPUs. In Proceedings of First International Workshop on Extreme Scale Programming Models and Middleware (ESPM2 2015), in conjunction with IEEE/ACM SC15, Austin, November 15, 2015.
    [paper] [slides]
  • Yukinori Sato, Shimpei Sato, Toshio Endo. Exana: An Execution-driven Application Analysis Tool for Assisting Productive Performance Tuning. In Proceedings of The Second Workshop on Software Engineering for Parallel Systems (SEPS), in conjunction with ACM SPLASH 2015, Pittsburgh, October 27, 2015.
    [ACM digital library]
  • Shimpei Sato, Yukinori Sato, Toshio Endo. Investigating Potential Performance Benefits of Memory Layout Optimization based on Roofline Model. In Proceedings of The Second Workshop on Software Engineering for Parallel Systems (SEPS), in conjunction with ACM SPLASH 2015, Pittsburgh, October 27, 2015.
    [ACM digital library]
  • Naoto Sasaki, Kento Sato, Toshio Endo, Satoshi Matsuoka. Exploration of Lossy Compression for Application-level Checkpoint/Restart. In Proceedings of IEEE International Conference on Parallel and Distributed Processing Symposium 2015 (IPDPS2015), pp. 914-922, Hyderabad, May 2015.
    [DOI:10.1109/IPDPS.2015.67] [IEEE digital library]
  • Yuki Tsujita, Toshio Endo. Data Driven Scheduling Approach for the Multi-node Multi-GPU Cholesky Decomposition. In Proceedings of Workshop on Job Scheduling Strategies for Parallel Processing (JSSPP), in conjunction with IPDPS 2015, Hyderabad, May 2015.
    [JSSPP15 site]
  • Kazuki Tsuzuku, Toshio Endo. Power Capping of CPU-GPU Heterogeneous Systems Using Power and Performance Models. In Proceedings of International Conference on Smart Cities and Green ICT Systems (SMARTGREENS2015), 8pages, Lisbon, May 2015.
    [IEEE digital library]

    Invited Talks

  • Toshio Endo. Harnessing Multi-tier Memory Hierarchy of GPU, Host and Flash. 2016 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing, Taipei, February 20, 2016.

    Other Presentations

  • Toshio Endo, Akira Nukada, Satoshi Matsuoka. Power Capping Scheduling on TSUBAME2.5 and Upgrade of TSUBAME-KFC. Building Energy Efficient HPC Working Group Workshop, held with SC15, Austin, November 16, 2015.
  • Toshio Endo, Satoshi Matsuoka. Realizing Extremely Large-Scale Stencil Applications on GPU Supercomputers with a Memory Hierarchy Management Runtime Library. Workshop on Programming Abstractions for Data Locality (PADAL 2015), Berkeley, June 25, 2015.

    Posters

  • Kazuki Tsuzuku, Toshio Endo. Online Power Capping of CPU-GPU Heterogeneous Systems, GPU Technology Conference Japan (GTC Japan), poster session, Tokyo, September 18, 2015.
  • Guanghao Jin, Toshio Endo. High Productive Framework to Enable Stencil Computation on Bigger Domains on TSUBAME2.5 , GPU Technology Conference Japan (GTC Japan), poster session, Tokyo, September 18, 2015.
  • Guanghao Jin,Toshio Endo. Efficient Utilization of GPU Cluster Resource for Stencil Computation. IPSJ HPCS 2015 symposium, Poster session, Tokyo, May 19, 2015.

    2015年度(日本語)

    学会発表(査読あり)

  • 高嵜 祐樹,遠藤 敏夫,松岡 聡. GPUクラスタにおける大規模都市気流シミュレーションの最適化と性能モデル. 情報処理学会ハイパフォーマンスコンピューティングと計算科学シンポジウム (HPCS2015), 東京,2015年5月20日.

    無査読論文

  • 遠藤 敏夫. 大規模・高性能演算のための多階層メモリの活用 . 情報処理学会研究報告, 2015-HPC-153 No.14, 7pages, 2016年3月2日.
  • 野村 哲弘,佐々木 淳,三浦 信一,遠藤 敏夫,松岡 聡. TSUBAME2におけるスケジュール効率化への取り組みとユーザ動向の見える化 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2015), 情報処理学会研究報告, 2015-HPC-150 No.2, 7pages, 2015年8月4日.
  • 寺西 賢人,野村 哲弘,遠藤 敏夫,松岡 聡. ノード内同時実行ジョブにおけるパフォーマンスカウンタによるプロセス毎消費電力のモデル化 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2015), 情報処理学会研究報告, 2015-HPC-150 No.28, 6pages, 2015年8月5日.
  • 佐藤幸紀,遠藤敏夫. 実行駆動型キャッシュシミュレーションおよびメモリ参照特性解析におけるオーバーヘッドの評価 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2015), 情報処理学会研究報告, 2015-ARC-216 No.31, 7pages, 2015年8月6日.
  • 佐藤真平,佐藤幸紀,遠藤敏夫. ルーフラインモデルによる性能幅推定とステンシル計算コードにおけるメモリレイアウト最適化による性能最大化 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2015), 情報処理学会研究報告, 2015-ARC-216 No.32, 6pages, 2015年8月6日.

    その他の発表

  • Yuki Tsujita, Toshio Endo, Katsuki Fujisawa. The Scalable Petascale Data-Driven Approach for the Cholesky Factorization with multiple GPUs . 2nd Annual Meeting on Advanced Computing System and Infrastructure (ACSI2016), 国外既発表論文紹介, 福岡,2016年1月19日.

    ポスター発表

  • 松宮遼,遠藤敏夫,大山恵弘. 深化する記憶装置階層のための大規模データ処理基盤の提案 . 第57回情報処理学会プログラミング・シンポジウム, ポスターセッション, 伊東,2016年1月.
  • Yukinori Sato and Toshio Endo. Consolidating memory locality information obtained from static and dynamic analysis of code for performance tuning in source code . 2nd Annual Meeting on Advanced Computing System and Infrastructure (ACSI2016), ポスターセッション, 福岡,2016年1月19日.
  • 辻田裕紀, 遠藤敏夫. マルチノード・マルチGPU上のコレスキー分解に対するデータドリブン型アルゴリズム手法. 情報処理学会ハイパフォーマンスコンピューティングと計算科学シンポジウム (HPCS2015), ポスターセッション, 東京,2015年5月19日.
  • 遠藤敏夫. 異種プロセッサマシンのメモリ階層を活用するHHRT ライブラリの実装. 情報処理学会ハイパフォーマンスコンピューティングと計算科学シンポジウム (HPCS2015), ポスターセッション, 東京,2015年5月19日.

    FY2014

    Refereed Papers

  • Guanghao Jin, James Lin, Toshio Endo. Efficient Utilization of Memory Hierarchy to Enable the Computation on Bigger Domains for Stencil Computation in CPU-GPU Based Systems . In Proceedings of IEEE International Conference on High Performance Computing and Applications (ICHPCA-2014), 6 pages, Bhubaneswar, December, 2014. [DOI:10.1109/ICHPCA.2014.7045354]
  • Toshio Endo, Akira Nukada, Satoshi Matsuoka. TSUBAME-KFC: a Modern Liquid Submersion Cooling Prototype towards Exascale Becoming the Greenest Supercomputer in the World . In Proceedings of The 20th IEEE International Conference on Parallel and Distributed Systems (ICPADS 2014), pp.360-367, Hsinchu, December, 2014. [DOI:10.1109/PADSW.2014.7097829] [paper] [slides]
  • Toshio Endo, Guanghao Jin. Software Technologies Coping with Memory Hierarchy of GPGPU Clusters for Stencil Computations . In Proceedings of IEEE Cluster Computing (CLUSTER2014), pp.132-139, Madrid, September 25, 2014. [DOI:10.1109/CLUSTER.2014.6968747] [paper] [slides]
  • Hiroko Midorikawa, Hideyuki Tan, Toshio Endo. An Evaluation of the Potential of Flash SSD as Large and Slow Memory for Stencil Computations . In Proceedings of The 2014 International Conference on High Performance Computing & Simulation (HPCS 2014), Bologna, Italy, July 24, 2014.
  • Katsuki Fujisawa, Toshio Endo, Yuichiro Yasui, Hitoshi Sato, Naoki Matsuzawa, Satoshi Matsuoka, Hayato Waki. Peta-scale General Solver for Semidefinite Programming Problems with over Two Million Constraints . In Proceedings of IEEE International Conference on Parallel and Distributed Processing Symposium 2014 (IPDPS2014), pp.1171-1180, Phoenix, USA, May 22, 2014. [DOI:10.1109/IPDPS.2014.121]

    Invited Talks

  • Toshio Endo. [Plenary Talk] Harnessing Memory Hierarchy towards Extreme Fast and Big Simulations. 2015 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing. Taipei, Feb 27, 2015.
  • Toshio Endo. Experiences with the 5.7Pflop/s System TSUBAME2.5 at Tokyo Tech. HP-CAST 22. Leipzig, Jun 20, 2014.

    Articles

  • Toshio Endo, Akira Nukada, Satoshi Matsuoka. TSUBAME-KFC: the Greenest Supercomputer in the World With Liquid Submersion Cooling . Global Scientific Information and Computing Center, Tokyo Institute of Technology, e-Science Journal, Vol. 11, pp. 2--7, June 2014.

    Unrefereed Papers

  • Tianqi Xu, Jin Guanghao, Endo Toshio, Matsuoka Satoshi. Efficient Utilization of Multi-level Memory System for Stencil Computation, IPSJ SIG Technical Report, 2014-HPC-147 No.10, 7 pages, Otaru, December 2014.

    Other Presentations

  • Toshio Endo. Locality Improvement of Stencil Computations for Big Simulations. JST/CREST International Symposium on Post Petascale System Software (ISP2S2), Kobe, December 4, 2014.
  • Toshio Endo. Software Technology that Deals with Deeper Memory Hierarchy in Post-petascale Era. 2014 ATIP Workshop: Japanese Research Toward Next-Generation Extreme Computing , New Orleans, November 17, 2014.
  • H. Nakamura, M. Kondo, K. Inoue, M. Schulz, T. Gamblin, B. Rountree, T. Endo, A. Nukada, S. Matsuoka. Power Management and Optimization toward Exascale Supercomputing. Workshop on International Cooperation for Extreme-Scale Computing, held with ISC'14, Leipzig, June 22, 2014.
  • Guanghao Jin, Mohamed Wahib, Naoya Maruyama, Toshio Endo, Satoshi Matsuoka. Locality Optimizations for Stencil Computations: Algorithms and Implementations, Workshop on Programming Abstractions for Data Locality (PADAL 2014), Lugano, April 28, 2014.

    Posters

  • Kazuki Tsuzuku, Toshio Endo. Power Capping of CPU-GPU Heterogeneous Systems using Power and Performance Models. GPU Technology Conference (GTC 2015), poster session, San Jose, March, 2015.
  • Toshio Endo, Yukinori Sato, Hiroko Midorikawa. Software Technology that Deals with Deeper Memory Hierarchy in Post-petascale Era. JST/CREST International Symposium on Post Petascale System Software (ISP2S2), poster session, Kobe, December 2, 2014.
  • Guanghao Jin, Toshio Endo. The Efficient Utilization of Memory Hierarchy on GPU Clusters. JST/CREST International Symposium on Post Petascale System Software (ISP2S2), poster session, Kobe, December 2, 2014.
  • Guanghao Jin, Toshio Endo. Data Management and Loop Controlling to Surpass Memory Capacity of GPU in OpenACC Framework. GTC Technology Conference Japan,poster session, Tokyo, July 16, 2014. [NVIDIA Award]
  • Naoto Sasaki, Kento Sato, Toshio Endo and Satoshi Matsuoka. Exploration of Application-level Lossy Compression for Fast Checkpoint/Restart. HPC in Asia poster session, held with ISC'14, Leipzig, June 2014.
  • Akihiro Nomura, Shin'ichi Miura, Toshio Endo and Satoshi Matsuoka. Application Performance Characterization towards Exa-scale Supercomputers. HPC in Asia poster session, held with ISC'14, Leipzig, June 2014.
  • Guanghao Jin, Toshio Endo and Satoshi Matsuoka. Efficient Utilization of Memory Hierarchy on GPU Clusters: Optimization Methods and Performance Models. HPC in Asia poster session, held with ISC'14, Leipzig, June 2014.

    2014年度(日本語)

    解説記事

  • 遠藤敏夫,額田彰,松岡聡. 超省エネスーパーコンピュータTSUBAME . 石油学会,PETROTECH, 第37巻8号, pp. 605--609, 2014年8月.
  • 遠藤敏夫,額田彰,松岡聡. TSUBAME-KFC: 液浸冷却を用いた世界一省エネなスーパーコンピュータ . 東京工業大学学術国際情報センター, TSUBAME e-Science Journal, No.11, pp. 2--7, 2014年6月.

    無査読論文

  • 高嵜 祐樹,遠藤 敏夫,松岡 聡. GPU搭載システムにおける都市気流シミュレーションの大規模化と性能モデル . 情報処理学会研究報告, 2015-HPC-148 No.13, 8pages, 2015年3月3日.
  • 高嵜 祐樹,遠藤 敏夫,松岡 聡. GPUクラスタ上の実ステンシルアプリケーションの大規模化に向けた局所性向上の評価 . 情報処理学会研究報告, 2014-HPC-146 No.23, 8pages, 2014年10月3日.
  • 佐々木尚人,佐藤賢斗,遠藤敏夫,松岡聡. 実アプリケーションにおけるウェーブレット変換を用いたチェックポイントデータの非可逆圧縮手法 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2014), 情報処理学会研究報告, 2014-HPC-145 No.7, 8pages, 2014年7月28日.
  • 都筑一希,遠藤敏夫. CPU・GPU 混載ノードにおける電力・性能モデルを用いたパワーキャッピング手法 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2014), 情報処理学会研究報告, 2014-HPC-145 No.10, 8pages, 2014年7月28日.
  • 野村 哲弘,三浦 信一,遠藤 敏夫,松岡 聡. 実アプリケーションを用いた計算機評価ベンチマークと性能リポジトリの開発 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2014), 情報処理学会研究報告, 2014-HPC-145 No.29, 7pages, 2014年7月29日.
  • 辻田裕紀,遠藤敏夫. マルチノード GPU 上のコレスキー分解へのデータドリブン型アルゴリズムの適用 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2014), 情報処理学会研究報告, 2014-HPC-145 No.46, 7pages, 2014年7月30日.
  • 遠藤 敏夫. ポストペタスケール時代に向けた格子系アルゴリズムの局所性向上手法 . 日本計算工学会 第19回計算工学講演会, オーガナイズドセッション19, 広島,2014年6月12日.

    その他の発表

  • 遠藤 敏夫. スーパーコンピュータの動向と東工大TSUBAME. 九州大学情報基盤研究開発センター 「数値シミュレーションだけではないスーパーコンピュータ活用」ワークショップ, 福岡,2015年1月14日.
  • 遠藤 敏夫. ポストペタスケール時代のメモリ階層の深化に対応するソフトウェア技術. 自動チューニング研究会 第6回 自動チューニング技術の現状と応用に関するシンポジウム(ATTA2014), 東京,2014年12月25日.
  • 遠藤 敏夫. 格子系アルゴリズムの局所性向上とHHRTライブラリ上の実装. メモリプラスワークショップ - メモリとファイルストレージとOSと−, 東京,2014年9月17日.
  • 遠藤 敏夫. 高性能計算のプログラミングの最前線. 日本ソフトウェア科学会 第31回大会PPLサマースクール2014, 名古屋,2014年9月7日. [発表スライド]
  • 遠藤 敏夫. 超省エネ液浸冷却スパコン TSUBAME-KFC. 日本能率協会 第14回熱設計・対策技術シンポジウム, 東京,2014年7月25日.

    ポスター発表

  • 高嵜 祐樹,遠藤 敏夫,松岡 聡. GPUクラスタ上での実アプリケーションに対するテンポラルブロッキングの実装と性能評価. GTC Technology Conference Japan, 東京,2014年7月16日.

    FY2013

    Refereed Papers

  • Guanghao Jin, Toshio Endo, Satoshi Matsuoka. A Parallel Optimization Method for Stencil Computation on the Domain that is Bigger than Memory Capacity of GPUs . In Proceedings of IEEE Cluster Computing (CLUSTER2013), pp. 1--8, Indianapolis, September 2013. [DOI: 10.1109/CLUSTER.2013.6702633]
  • Yukinori Sato, Hiroko Midorikawa, and Toshio Endo. Identifying working data set of particular loop iterations for dynamic performance tuning. In 6th Workshop on Architectural and Microarchitectural Support for Binary Translation (AMAS-BT2013). Held in conjunction with the 40th Int'l Symposium on Computer Architecture (ISCA-40), Tel-Aviv, Israel, pp. 1-6, Jun. 24, 2013.
  • Guanghao Jin, Toshio Endo, Satoshi Matsuoka. A Multi-level Optimization Method for Stencil Computation on the Domain that is Bigger than Memory Capacity of GPU . In Proceedings of The Third International Workshop on Accelerators and Hybrid Exascale Systems (AsHES), in conjunction with IEEE IPDPS 2013, pp. 1080--1087, Boston, May 2013. [DOI: 10.1109/IPDPSW.2013.58]

    Unrefereed Papers

  • Jin Guanghao, Endo Toshio, Matsuoka Satoshi. Multi-level Temporal Blocking for Stencil Computation for Memory Hierarchy on TSUBAME2.5, IPSJ SIG Technical Report, 2014-HPC-143 No.33, 8 pages, Nanao, March 2014.

    Posters

  • Guangho Jin, Tomoki Kawamura, Naoya Maruyama, Toshio Endo, Satoshi Matsuoka. Optimization Methods for Efficient Utilization of Memory Hierarchy on GPU Cluster, GPU Technology Conference (GTC2014), poster session, San Jose, March 2014.
  • Katsuki Fujisawa, Toshio Endo, Hitoshi Sato, Yuichiro Yasui, Naoki Matsuzawa, Hayato Waki. Peta-Scale General Solver for Semidefinite Programming Problems with Over Two Million Constraints, IEEE/ACM SC13, poster session, Denver, November 2013.
  • Katsuki Fujisawa, Toshio Endo, Hitoshi Sato, Yuichiro Yasui, Naoki Matsuzawa, Hayato Waki. Peta-scale General Solver for Semidefinite Programming Problems with over Two Million Constraints, GPU Technology Conference Japan (GTC Japan), poster session, Tokyo, June 2013. [NVIDIA Award]

    Other Presentations

  • Toshio Endo. Software Technology that Deals with Deeper Memory Hierarchy in Post-petascale Era, The Japanese Extreme Big Data Projects Workshop, Fukuoka, Japan, February 2014. [slides]

    2013年度(日本語)

    招待講演

  • 遠藤 敏夫. ポストペタスケール時代に向けた格子系アルゴリズムの局所性向上. 自動チューニング研究会 第5回 自動チューニング技術の現状と応用に関するシンポジウム, 東京,2013年12月. [slide]
  • 遠藤 敏夫. TSUBAME2.0/2.5スーパーコンピュータとポストペタスケール時代に向けた課題. 日本学術会議 電気電子工学委員会 URSI分科会 無線通信システム信号処理小委員会 (URSI-C) 第22期 第8回公開研究会, 沖縄,2013年9月.

    解説記事

  • 渡辺治,遠藤敏夫. スーパーコンピューティング・コンテスト2013 . 日本評論社, 数学セミナー, 第53巻1号, 2014年1月号, pp. 50--55.

    無査読論文

  • 遠藤 敏夫,額田 彰,松岡 聡. ウルトラグリーンスパコンTSUBAME2.5/TSUBAME-KFC . 大学ICT推進協議会2013年度年次大会講演論文集, T5G-4, 2013年12月.
  • 三浦 信一, 渡邊 寿雄, 佐藤 仁, 遠藤 敏夫. 東京工業大学のHPCIに関する取り組み . 大学ICT推進協議会2013年度年次大会講演論文集, T3G-3, 2013年12月.
  • 遠藤 敏夫,額田 彰,松岡 聡. TSUBAME-KFC: 液浸冷却を用いたウルトラグリーンスパコン研究設備 . ハイパフォーマンスコンピューティングとアーキテクチャの評価に 関する北海道ワークショップ(HOKKE), 情報処理学会研究報告, 2013-ARC-199/HPC-142, 2013年12月. [slides]
  • 松岡 聡,佐藤 賢斗,遠藤 敏夫. エクサスケールスパコンに向けた耐故障性の評価 --- TSUBAME2.0を例にして --- . 情報処理学会研究報告, 2013-HPC-141 No.22, 8 pages, 2013年10月.
  • 遠藤 敏夫. 並列プログラムをメモリ階層利用可能とするランタイム . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2013), 情報処理学会研究報告, 2013-HPC-140 No.43, 8 pages, 2013年8月. [paper, slides]
  • 野村 哲弘,三浦 信一,遠藤 敏夫,松岡 聡,鈴木 惣一朗,丸山 直也. システム評価のためのアプリケーション性能リポジトリの構築と性能モデルの評価 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2013), 情報処理学会研究報告, 2013-HPC-140 No.4, 6 pages, 2013年7月.

    その他の発表

  • 遠藤 敏夫. IEEE SC13 (参加報告). グリッド協議会 第41回ワークショップ, 東京,2014年1月.
  • 遠藤 敏夫. ポストペタスケール時代のメモリ階層の深化に対応するソフトウェア技術. HPCワークショップ金沢, 金沢,2013年10月.

    FY2012

    Refereed Papers

  • Katsuki Fujisawa, Toshio Endo, Hitoshi Sato, Makoto Yamashita, Satoshi Matsuoka, Maho Nakata. High-Performance General Solver for Extremely Large-scale Semidefinite Programming Problems. In Proceedings of IEEE/ACM International Conference for High Performance Computing, Networking, Storage and Analysis (SC12), pp. 1-11. Saltlake City, November 2012. [DOI: 10.1109/SC.2012.67]

    Posters

  • Keisuke Fukuda, Naoya Maruyama, Toshio Endo, Miquel Pericas, Satoshi Matsuoka. Fast Multipole Method on a Heterogeneous Dynamic Task Scheduling Engine, GPU Technology Conference (GTC), poster session, San Jose, March 2013.

    2012年度(日本語)

    解説記事

  • 藤澤克樹,遠藤敏夫. 大規模半正定値計画問題に対する内点法アルゴリズムの高速計算 . 東京工業大学学術国際情報センター, TSUBAME e-Science Journal, No.7, 2012年12月, pp. 2--6.

    無査読論文

  • 金 光浩,遠藤 敏夫,松岡 聡. GPUメモリ容量を超える問題規模に対応する高性能ステンシル計算法 . ハイパフォーマンスコンピューティングとアーキテクチャの評価に 関する北海道ワークショップ(HOKKE-20), 情報処理学会研究報告, 2012-ARC-194/HPC-137, 6 pages, 2012年12月.
  • 野村 哲弘,遠藤 敏夫,松岡 聡. TSUBAME2.0におけるMulti-rail InfiniBandネットワークの性能評価 . ハイパフォーマンスコンピューティングとアーキテクチャの評価に 関する北海道ワークショップ(HOKKE-20), 情報処理学会研究報告, 2012-ARC-194/HPC-137, 2012年12月.

    その他の発表

  • 遠藤 敏夫. ポストペタスケール時代のメモリ階層の深化に対応するソフトウェア技術. JST ERATO 湊離散構造処理系プロジェクトセミナー, 札幌,2012年12月.


    FY2011

    Refereed Papers

  • Takashi Shimokawabe, Takayuki Aoki, Tomohiro Takaki, Akinori Yamanaka, Akira Nukada, Toshio Endo, Naoya Maruyama, Satoshi Matsuoka. Peta-scale Phase-Field Simulation for Dendritic Solidification on the TSUBAME 2.0 Supercomputer. In Proceedings of IEEE/ACM International Conference for High Performance Computing, Networking, Storage and Analysis (SC11), pp. 1--11, Seattle, November 2011. [DOI: 10.1145/2063384.2063388] [ACM Gordon Bell Prize Special Achievements in Scalability and Time-to-Solution]
  • Massimo Bernaschi, Mauro Bisson, Toshio Endo, Massimiliano Fatica, Satoshi Matsuoka, Simone Melchionna, Sauro Succi. Petaflop Biofluidics Simulations On A Two Million-Core System. In Proceedings of IEEE/ACM International Conference for High Performance Computing, Networking, Storage and Analysis (SC11), pp. 1--12, Seattle, November 2011. [DOI: 10.1145/2063384.2063389]
  • Shiqiao Du, Takuro Udagawa, Toshio Endo and Masakazu Sekijima. Molecular Dynamics Simulation of a Biomolecule with High Speed, Low Power and Accuracy Using GPU-Accelerated TSUBAME2.0 Supercomputer. In Proceedings of Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2011), Xi'an, October 2011.

    Invited Talks

  • Toshio Endo. TSUBAME2.0: A Petascale GPU-accelerated Supercomputer, The Second International Conference on Networking and Computing (ICNC'11), Tutorial, Osaka, December 2011.

    Unrefereed Papers

  • Irina Demeshko, Satoshi Matsuoka, Toshio Endo. GPU-based approach for elastic-plastic deformation simulation, Summer United Workshops on Parallel, Distributed and Cooperative Processing (SWoPP 2011), IPSJ SIG Technical Report, 2011-HPC-130 No.12, 7 pages, Kagoshima, August 2011.

    2011年度(日本語)

    論文誌

  • 遠藤 敏夫,額田 彰,松岡 聡. スーパーコンピュータTSUBAME 2.0 における Linpack 性能1 ペタフロップス超の達成. 情報処理学会論文誌コンピューティングシステム, Vol. 4, No.4 (ACS 35), pp.169-179, 2011年10月.

    学会発表(査読あり)

  • 遠藤 敏夫,額田 彰,松岡 聡. スーパーコンピュータTSUBAME 2.0 における Linpack 性能1 ペタフロップス超の達成. 情報処理学会 先進的計算基盤システムシンポジウム(SACSIS2011)論文集, 2011年5月. [paper]

    解説記事

  • 下川辺隆史,青木尊之,高木知弘,山中晃徳,額田 彰,遠藤敏夫,丸山直也,松岡 聡. TSUBAME 2.0スパコンにおける樹枝状凝固成長のフェーズフィールド法を用いたペタスケール・シミュレーション . 東京工業大学学術国際情報センター, TSUBAME e-Science Journal, No.5, 2012年2月, pp. 3--8.
  • Massimo Bernaschi,Mauro Bisson,遠藤 敏夫,Massimiliano Fatica,松岡 聡,Simone Melchionna,Sauro Succi TSUBAME2 における大規模生体流体力学シミュレーション . 東京工業大学学術国際情報センター, TSUBAME e-Science Journal, No.5, 2012年2月, pp. 9--13.
  • 遠藤 敏夫. ペタスケールグリーンスパコンTSUBAME2.0. 日本計算工学会,計算工学,Vol. 16, No. 3, pp.34-35, 2011年7月.

    無査読論文

  • 遠藤 敏夫,松岡 聡,額田 彰,長坂真路,四津匡康. グリーンスパコンTSUBAME2.0における電力危機対応運用 . ハイパフォーマンスコンピューティングとアーキテクチャの評価に 関する北海道ワークショップ(HOKKE-19), 情報処理学会研究報告, 2011-ARC-189/HPC-132, 9 pages, 2011年11月.

    FY2010

    Refereed Papers

  • Takashi Shimokawabe, Takayuki Aoki, Chiashi Muroi, Junichi Ishida, Kohei Kawano, Toshio Endo, Akira Nukada, Naoya Maruyama, Satoshi Matsuoka. An 80-Fold Speedup, 15.0 TFlops, Full GPU Acceleration of Non-Hydrostatic Weather Model ASUCA Production Code. In Proceedings of IEEE/ACM International Conference for High Performance Computing, Networking, Storage and Analysis (SC10), pp.1-11, New Orleans, November 2010.
  • Hitoshi Nagasaka, Naoya Maruyama, Akira Nukada, Toshio Endo, and Satoshi Matsuoka, Statistical Power Modeling of GPU Kernels Using Performance Counters. Proceedings of International Green Computing Conference (IGCC'10), pp. 115--122, Chicago, IL, USA, Aug 2010.
  • Toshio Endo, Akira Nukada, Satoshi Matsuoka and Naoya Maruyama. Linpack Evaluation on a Supercomputer with Heterogeneous Accelerators. In Proceedings of IEEE International Parallel & Distributed Processing Symposium (IPDPS 2010), Atlanta, pp.1-8, April 2010. [paper] [slides]

    Unrefereed Papers

  • Nguyen Toan, Hideyuki Jitsumoto, Naoya Maruyama, Tatsuo Nomura, Toshio Endo, Satoshi Matsuoka. MPI-CUDA Applications Checkpointing, Summer United Workshops on Parallel, Distributed and Cooperative Processing (SWoPP 2010), IPSJ SIG Technical Report, 2010-HPC-126 No.18, 7 pages, Kanazawa, August 2010.

    2010年度(日本語)

    論文誌

  • 遠藤 敏夫,額田 彰,松岡 聡. 異種アクセラレータを持つTSUBAMEスーパーコンピュータの Linpack評価. 日本応用数理学会, 応用数理, Vol. 20, No. 2, pp. 29-36, 2010年6月.

    解説記事

  • 松岡聡,遠藤敏夫,丸山直也,佐藤仁,滝澤真一朗. TSUBAME 2.0の全貌. 東京工業大学学術国際情報センター, TSUBAME e-Science Journal, No.1, 2010年9月, pp. 2--4.
  • 松岡聡,青木尊之,遠藤敏夫,丸山直也,佐藤仁,滝澤真一朗,實本英之. TSUBAMEの造り方から探る PCクラスターと「スパコン」のあいだ. アスキー・メディアワークス, 月刊ASCII .technologies 2010年7月号, pp. 48--55.

    無査読論文

  • 遠藤 敏夫,額田 彰,松岡 聡. ヘテロ型スーパーコンピュータTSUBAME 2.0のLinpackによる性能評価 . ハイパフォーマンスコンピューティングとアーキテクチャの評価に 関する北海道ワークショップ(HOKKE-18), 情報処理学会研究報告, 2010-ARC-192/HPC-128, 6 pages, 2010年12月.
  • 長坂 仁,丸山 直也,額田 彰,遠藤 敏夫,松岡 聡. GPUにおけるモデルに基づいた電力効率の最適化 . ハイパフォーマンスコンピューティングとアーキテクチャの評価に 関する北海道ワークショップ(HOKKE-18), 情報処理学会研究報告, 2010-ARC-192/HPC-128, 6 pages, 2010年12月.
  • 野村 達雄,丸山 直也,遠藤 敏夫,松岡 聡. ステンシル計算を対象とした大規模GPUクラスタ向け自動並列化フレームワーク . ハイパフォーマンスコンピューティングとアーキテクチャの評価に 関する北海道ワークショップ(HOKKE-18), 情報処理学会研究報告, 2010-ARC-192/HPC-128, 9 pages, 2010年12月.
  • 島田 大地,遠藤 敏夫,丸山 直也,松岡 聡. OpenCLを用いた異種GPUにおける性能特性に応じた最適化 . ハイパフォーマンスコンピューティングとアーキテクチャの評価に 関する北海道ワークショップ(HOKKE-18), 情報処理学会研究報告, 2010-ARC-192/HPC-128, 7 pages, 2010年12月.
  • 野村達雄,丸山直也,遠藤敏夫,松岡聡. GPUクラスタを対象にした並列ステンシル計算の自動コード生成フレームワーク . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2010), 情報処理学会研究報告, 2010-HPC-126 No.9, 10 pages, 2010年8月.

    ポスター発表

  • 野村 達雄,丸山 直也,遠藤 敏夫,松岡 聡. ステンシル計算を対象とした大規模GPUクラスタ向け自動並列化フレームワーク . 情報処理学会ハイパフォーマンスコンピューティングと計算科学シンポジウム (HPCS2011), ポスターセッション, 2011年1月.

    FY2009

    Journal Article

    Satoshi Matsuoka, Takayuki Aoki, Toshio Endo, Akira Nukada, Toshihiro Kato and Atushi Hasegawa. GPU accelerated computing?from hype to mainstream, the rebirth of vector computing. Journal of Physics: Conference Series, Vol 180, 10 pages, 2009. [DOI: 10.1088/1742-6596/180/1/012043]

    Refereed Papers

  • Tomoaki Hamano, Toshio Endo and Satoshi Matsuoka. Power-Aware Dynamic Task Scheduling for Heterogeneous Accelerated Clusters. In Proceedings of The Fourth Workshop on High-Performance, Power-Aware Computing (HPPAC), in conjunction with IPDPS 2009, pp.1-8, May 2009.
  • Hitoshi Sato, Satoshi Matsuoka and Toshio Endo. File Clustering Based Replication Algorithm in a Grid Environment. In Proceedings of IEEE International Symposium on Cluster Computing and the Grid (CCGrid 2009), pp.204-211, May 2009.

    Invited Talks

  • Toshio Endo. Supercomputing on The TSUBAME GPU-Accelerated Cluster, CSIRO GPU Cluster Workshop, Melbourne, June 2009.

    2009年度(日本語)

    論文誌

  • 滝澤 真一朗,遠藤 敏夫,松岡 聡. 次世代光インターコネクトでのMPI通信に関する研究. 日本ソフトウェア科学会コンピュータソフトウェア, Vol. 26, No. 3, pp. 5-19, 2009年7月.

    招待講演

  • 遠藤 敏夫. 東京工業大学TSUBAMEスパコンとGPU計算への取り組み. グリッド協議会金融分科会ミーティング, 2010年1月.

    無査読論文

  • 浜野智明,額田彰,遠藤敏夫,松岡聡. GPUクラスタにおける省電力タスクスケジューリング . 情報処理学会研究報告,Vol. 2010-HPC-124 No. 17, pp. 1-9, 2010年2月.
  • 渡辺祐也,遠藤敏夫,松岡聡. GPU クラスタにおける科学技術計算の自動最適化 . 情報処理学会研究報告, Vol. 2010-HPC-124 No. 18, pp.1-7, 2010年2月.
  • 實本英之,中村俊介,遠藤敏夫,松岡聡. 増分データとErasure Codingを利用した高速なチェックポイント手法 . 情報処理学会研究報告,Vol. 2010-HPC-122 No. 9, pp. 1-6, 2009年10月.
  • 遠藤敏夫,額田彰,松岡聡,丸山直也. 異種アクセラレータを持つヘテロ型スーパーコンピュータ上の Linpackの性能向上手法 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2009), 情報処理学会研究報告, 2009-HPC-121 No.24, 8 pages, 2009年8月. [paper]
  • 島田大地,丸山直也,額田彰,遠藤敏夫,松岡聡. GPUにおける耐故障性を考慮した数値計算の電力性能 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2009), 情報処理学会研究報告, 2009-HPC-121 No.26, 6 pages, 2009年8月.
  • 長坂仁,丸山直也,額田彰,遠藤敏夫,松岡聡. GPUにおける性能と消費電力の相関性の解析 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2009), 情報処理学会研究報告, 2009-HPC-121 No.27, 5 pages, 2009年8月.
  • 加藤季広,青木尊之,額田 彰,遠藤敏夫,松岡 聡,長谷川篤史. 姫野ベンチマークのGPUマルチノード実行における通信と演算のオーバーラップによる高速化 〜 32GPUで700GFLOPS超を達成 〜 . 情報処理学会研究報告, 2009-HPC-120 No.3, 6 pages, 2009年6月.

    ポスター発表

  • 長坂 仁,丸山直也,額田 彰,遠藤敏夫,松岡 聡. GPUにおける性能と消費電力の相関性の解析. 情報処理学会 先進的基盤システムシンポジウム (SACSIS2009), ポスターセッション, 2009年5月.
  • 島田大地,丸山直也,額田 彰,遠藤敏夫,松岡 聡. GPUにおける耐故障性を考慮した数値計算の電力性能. 情報処理学会 先進的基盤システムシンポジウム (SACSIS2009), ポスターセッション, 2009年5月.

    FY2008

    Refereed Papers

  • Hideyuki Jitsumoto, Toshio Endo and Satoshi Matsuoka. Environmental-Aware Optimization of MPI Checkpointing Intervals . In Proceedings of HPC ASIA 2009, pp. 285--292, March 2009.
  • Akira Nukada, Yasuhiko Ogata, Toshio Endo and Satoshi Matsuoka. Bandwidth Intensive 3-D FFT kernel for GPUs using CUDA . In Proceedings of IEEE/ACM International Conference for High Performance Computing, Networking, Storage and Analysis (SC08), pp.1-11, November 2008.
  • Hitoshi Sato, Satoshi Matsuoka, Toshio Endo and Naoya Maruyama. Access-Pattern and Bandwidth Aware File Replication Algorithm in a Grid Environment. In Proceedings of IEEE/ACM International Conference on Grid Computing (Grid 2008), pp.250-257, October 2008.
  • Toshio Endo and Satoshi Matsuoka. Massive Supercomputing Coping with Heterogeneity of Modern Accelerators . In Proceedings of IEEE International Parallel & Distributed Processing Symposium (IPDPS 2008), pp.1-10, April 2008. [paper] [slides]
  • Shin'ichiro Takizawa, Toshio Endo and Satoshi Matsuoka. Locality Aware MPI Communication on a Commodity Opto-Electronic Hybrid Network. In Proceedings of Workshop on Large-Scale Parallel Processing (LSPP), in conjunction with IEEE IPDPS 2008, pp.1-8, April 2008.
  • Yasuhiko Ogata, Toshio Endo, Naoya Maruyama and Satoshi Matsuoka. An Efficient, Model-Based CPU-GPU Heterogeneous FFT Library. In Proceedings of 17th International Heterogeneity in Computing Workshop (HCW '08), in conjunction with IEEE IPDPS 2008, pp.1-10, April 2008.
  • Yuto Hosogaya, Toshio Endo and Satoshi Matsuoka. Performance Evaluation of Parallel Applications on Next Generation Memory Architecture with Power-Aware Paging Method. In Proceedings of The Fourth Workshop on High-Performance, Power-Aware Computing (HPPAC), in conjunction with IPDPS 2008, pp.1-8, April 2008.

    Posters

  • Hideyuki Jitsumoto, Toshio Endo, Satoshi Matsuoka. Environmental-Aware Optimization of MPI Checkpointing Intervals, IEEE International Conference on Cluster Computing (Cluster 2008), poster session, September 2008.

    2008年度(日本語)

    論文誌

  • 額田 彰,尾形 泰彦,遠藤 敏夫,松岡 聡. CUDA 環境における高性能3次元FFT, 情報処理学会論文誌コンピューティングシステム,Vol. 1, No.2 (ACS 23), pp. 231-239,2008年8月.
  • 尾形 泰彦,遠藤 敏夫,丸山 直也,松岡 聡. 性能モデルに基づくCPU及びGPUを併用する効率的なFFTライブラリ. 情報処理学会論文誌コンピューティングシステム,Vol.1,No.1 (ACS 22), pp. 40-50,2008年6月.

    学会発表(査読あり)

  • 滝澤 真一朗,遠藤 敏夫,松岡 聡. 光サーキットネットワークの補助的利用によるHPCアプリケーション性能向上. 情報処理学会 ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2009)論文集, pp. 65-72, 2009年1月.
  • 額田 彰,尾形 泰彦,遠藤 敏夫,松岡 聡. CUDA 環境における高性能3次元FFT. 情報処理学会 先進的計算基盤システムシンポジウム(SACSIS2008)論文集, pp.81-88, 2008年6月.
    [優秀若手研究賞(額田)]

    招待講演

  • 遠藤 敏夫. TSUBAMEにおけるアクセラレータの利用状況について. 並列生物情報処理イニシアティブ(IPAB)アクセラレータWGセミナー, 2008年9月.
  • 遠藤 敏夫. アクセラレータを用いた大規模ヘテロ環境におけるLinpack. 九州大学情報基盤研究開発センター 先駆的科学計算に関するフォーラム2008, 2008年9月. [slides]

    解説記事

  • 遠藤 敏夫. 東京工業大学TSUBAMEにおけるアクセラレータ活用事例. 情報処理,Vol. 50, No. 2, pp.100-106, 2009年2月.

    無査読論文

  • 遠藤敏夫,額田 彰,松岡 聡,丸山直也,實本英之. 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング . ハイパフォーマンスコンピューティングとアーキテクチャの評価に 関する北海道ワークショップ(HOKKE2009), 情報処理学会研究報告, 2009-ARC-182/HPC-119, pp.25-30, 2009年2月. [paper]
  • 細萱祐人,遠藤敏夫,松岡 聡. スワップコストの動的推定によるメモリの省電力化手法 . ハイパフォーマンスコンピューティングとアーキテクチャの評価に 関する北海道ワークショップ(HOKKE2009), 情報処理学会研究報告, 2009-ARC-182/HPC-119, pp.85-90, 2009年2月.
  • 山崎翔平,遠藤敏夫,松岡 聡. プロセス間共通メモリイメージを考慮したマイグレーション最適化 . ハイパフォーマンスコンピューティングとアーキテクチャの評価に 関する北海道ワークショップ(HOKKE2009), 情報処理学会研究報告, 2009-ARC-182/HPC-119, pp.145-150, 2009年2月.
  • 千葉 立寛,遠藤 敏夫,松岡 聡. グリッド環境におけるMPI Scatter/Gather通信アルゴリズムの最適化 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2008), 情報処理学会研究報告, 2008-HPC-116, pp.13-18, 2008年8月.
  • 滝澤 真一朗,遠藤 敏夫,松岡 聡. 光ネットワークの補助的利用によるHPC性能向上 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2008), 情報処理学会研究報告, 2008-HPC-116, pp.67-72, 2008年8月.
  • 佐藤 仁,松岡 聡,遠藤 敏夫. 広域分散ファイルシステムにおけるアクセスパターンと性能を考慮したファイル配置 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2008), 情報処理学会研究報告, 2008-HPC-116, pp.211-216, 2008年8月.
  • 渡辺祐也,遠藤敏夫,松岡聡. 複数GPUにおけるセルフスケジューリングによる並列数値演算 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2008), 情報処理学会研究報告, 2008-ARC-179, pp.85-90, 2008年8月.
  • 浜野智明,遠藤敏夫,松岡聡. ヘテロ計算環境のための省電力タスクスケジューリング . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2008), 電子情報通信学会技術研究報告,Vol.108 No.180 (CPSY2008-27), pp.97-102, 2008年8月.
  • 丸山直也,松岡聡,尾形泰彦,額田彰,遠藤敏夫. ソフトウェアECCによるGPUメモリの耐故障性の実現と評価 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2008), 電子情報通信学会技術研究報告DC2008-20, pp.9-16, 2008年8月.

    ポスター発表

  • 遠藤 敏夫,額田 彰,松岡 聡,丸山 直也,實本 英之. 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング. 情報処理学会 ハイパフォーマンスコンピューティングと計算科学シンポジウム (HPCS2009),ポスターセッション, 2009年1月.
  • 尾形 泰彦,額田 彰,丸山 直也,遠藤 敏夫,松岡 聡. 複数 GPU システムに対応する自動最適化 3D-FFT ライブラリ. 情報処理学会 ハイパフォーマンスコンピューティングと計算科学シンポジウム (HPCS2009),ポスターセッション, 2009年1月.
  • 山崎 翔平,遠藤 敏夫,松岡 聡. プロセス間共通メモリイメージを考慮したマイグレーション最適化. 情報処理学会 ハイパフォーマンスコンピューティングと計算科学シンポジウム (HPCS2009),ポスターセッション, 2009年1月.
  • 細萱 祐人,遠藤 敏夫,松岡 聡. SWAPアクセス数の実行時推定によるメモリの省電力化手法. 情報処理学会 ハイパフォーマンスコンピューティングと計算科学シンポジウム (HPCS2009),ポスターセッション, 2009年1月.
  • 渡辺 裕也,遠藤 敏夫,松岡 聡. 不均一な複数GPUにおけるセルフスケジューリングによる並列数値演算. 情報処理学会 先進的基盤システムシンポジウム (SACSIS2008), ポスターセッション, 2008年6月.
  • 浜野 智明,遠藤 敏夫,松岡 聡. ヘテロ計算環境のための省電力タスクスケジューリング. 情報処理学会 先進的基盤システムシンポジウム (SACSIS2008), ポスターセッション, 2008年6月.

    FY2007

    Refereed Papers

  • Tatsuhiro Chiba, Toshio Endo and Satoshi Matsuoka. High-Performance MPI Broadcast Algorithm for Grid Environments Utilizing Multi-lane NICs. In Proceedings of IEEE/ACM International Symposium on Cluster Computing and the Grid (CCGrid2007), pp.487--494, May 2007.

    Posters

  • Toshio Endo, Satoshi Matsuoka. A Methodology for Coping with Heterogeneity of Modern Accelerators on a Massive Supercomputing Scale, ACM/IEEE Conference on Supercomputing (High Performance Computing, Networking, Storage and Analysis) (SC07), poster session, November 2007. [poster]

    Other Presentations

  • Tatsuhiro Chiba, Toshio Endo, Satoshi Matsuoka. High Performance MPI Broadcast Algorithm for Grid Environments with Long-fat Pipes, Korea-Japan Grid Symposium 2007, Sapporo, Japan, July 2007.

    2007年度(日本語)

    論文誌

  • 遠藤 敏夫, 松岡 聡, 橋爪 信明, 長坂 真路. ヘテロ型スーパーコンピュータTSUBAMEのLinpackによる性能評価. 情報処理学会論文誌コンピューティングシステム, Vol.48, No.SIG 8 (ACS 18), pp.62-70, May 2007.
  • 千葉 立寛, 遠藤 敏夫, 松岡 聡. グリッド環境におけるマルチレーンを用いたMPIコレクティブ通信アルゴリズム. 情報処理学会論文誌コンピューティングシステム, Vol.48, No.SIG 8 (ACS 18), pp.104-113, May 2007.

    学会発表(査読あり)

  • 細萱 祐人, 遠藤 敏夫, 松岡 聡. 省電力ページング方式を実装した次世代メモリアーキテクチャ上での並列プログラムの評価. 情報処理学会 ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2008)論文集, pp.25-32, January 2008.
  • 尾形 泰彦, 遠藤 敏夫, 丸山 直也, 松岡 聡. 性能モデルに基づくCPU及びGPUを併用する効率的なFFTライブラリ. 情報処理学会 ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2008)論文集, pp.107-114, January 2008.

    無査読論文

  • 遠藤 敏夫,松岡 聡. 情報爆発時代へ向けた不均一アーキテクチャにおける スーパーコンピューティング. 第70回情報処理学会全国大会論文集,6K-2, 2pages, March 2008. [paper]
  • 佐藤 仁,松岡 聡,遠藤 敏夫. 情報爆発時代のグリッドファイルシステム上での大規模データ管理. 第70回情報処理学会全国大会論文集,5K-4, 2pages, March 2008.
  • 實本 英之,遠藤 敏夫,松岡 聡. 情報爆発に対応する耐故障性 MPI フレームワークの提案. 第70回情報処理学会全国大会論文集,6K-3, 2pages, March 2008.
  • 滝澤 真一朗,遠藤 敏夫,松岡 聡. 情報爆発時代の光インターコネクト上でのMPI通信アルゴリズム . 第70回情報処理学会全国大会論文集,6K-5, 2pages, March 2008.
  • 千葉 立寛,遠藤 敏夫,松岡 聡. 情報爆発時代のグリッド環境に対応したMPI集団通信アルゴリズムの最適化 . 第70回情報処理学会全国大会論文集,6K-4, 2pages, March 2008.
  • 滝澤 真一朗, 遠藤 敏夫, 松岡 聡. 次世代光インターコネクト上でのMPI通信性能の評価. 日本ソフトウェア科学会第24会大会論文集, September 2007.
  • 尾形 泰彦, 遠藤 敏夫, 松岡 聡. CPUおよびGPUを併用するFFTライブラリの提案と評価. 並列/分散/協調処理に関するサマーワークショップ(SWoPP2007), 情報処理学会研究報告, 2007-HPC-111, pp.13-18, August 2007.
  • 佐藤 仁, 松岡 聡, 遠藤 敏夫. 広域分散環境における大規模データ管理のためのノードグルーピング. 並列/分散/協調処理に関するサマーワークショップ(SWoPP2007), 情報処理学会研究報告, 2007-HPC-111, pp.109-114, August 2007.
  • 滝澤 真一朗, 遠藤 敏夫, 松岡 聡. 次世代光インターコネクト上でのMPIアプリケーションの評価. 並列/分散/協調処理に関するサマーワークショップ(SWoPP2007), 情報処理学会研究報告, 2007-HPC-111, pp.183-188, August 2007.
  • 細萱 祐人, 遠藤 敏夫, 松岡 聡. 次世代省電力メモリを用いた並列プログラムの省電力化の評価. 並列/分散/協調処理に関するサマーワークショップ(SWoPP2007), 情報処理学会研究報告, 2007-ARC-174, pp.49-54, August 2007.

    ポスター発表

  • 尾形 泰彦, 遠藤 敏夫, 松岡 聡. GPUおよびCPUを併用する高効率のFFTライブラリ. 情報処理学会 先進的基盤システムシンポジウム (SACSIS2007), ポスターセッション, May 2007.
  • 細萱 祐人, 遠藤 敏夫, 松岡 聡. 次世代低消費電力メモリ技術によるHPCの省電力最適化. 情報処理学会 先進的基盤システムシンポジウム (SACSIS2007), ポスターセッション, May 2007.

    その他の発表

  • 遠藤 敏夫. 不均一アーキテクチャにおけるスーパーコンピューティング. 東京工業大学グローバルCOE「計算世界観の深化と展開」発足シンポジウム, 2007年12月.

    FY2006

    Refereed Papers

  • Hideyuki Jitsumoto, Toshio Endo and Satoshi Matsuoka. ABARIS: An Adaptable Fault Detection/Recovery Component Framework for MPIs. In Proceedings of 12th IEEE Workshop on Dependable Parallel, Distributed and Network-Centric Systems (DPDNS '07), in conjunction with IPDPS 2007, pp.1-8, March 2007.

    2006年度(日本語)

    学会発表(査読あり)

  • 遠藤 敏夫, 松岡 聡, 橋爪 信明, 長坂 真路. ヘテロ型スーパーコンピュータTSUBAMEのLinpackによる性能評価. 情報処理学会 ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2007)論文集, pp.33-40, January 2007. [paper]
  • 千葉 立寛, 遠藤 敏夫, 松岡 聡. グリッド環境におけるマルチレーンを用いたMPIコレクティブ通信アルゴリズム. 情報処理学会 ハイパフォーマンスコンピューティングと計算科学シンポジウム(HPCS2007)論文集, pp.95-102, January 2007.

    招待講演

  • 遠藤 敏夫. アクセラレータを用いたヘテロ型スーパーコンピュータ上の並列計算 . 電子情報通信学会コンピュータシステム研究会(CPSY), 信学技報, Vol.106, No.287, pp. 27-32, CPSY2006-29, October 2006. [paper] [link]

    無査読論文

  • 實本 英之, 遠藤 敏夫, 松岡 聡. フォールト/リカバリモデルを考慮した耐故障性をもつ MPIフレームワーク ABARIS. ハイパフォーマンスコンピューティングとアーキテクチャの評価に 関する北海道ワークショップ(HOKKE2007), 情報処理学会研究報告, 2007-HPC-109, pp.163-168, March 2007.
  • 遠藤 敏夫, 松岡 聡, 橋爪 信明, 長坂 真路, 後藤 和茂. ヘテロ型スーパーコンピュータTSUBAMEのLinpackによる性能評価. 並列/分散/協調処理に関するサマーワークショップ(SWoPP2006), 情報処理学会研究報告, 2006-HPC-107, pp.43-48, July 2006. [paper]
  • 鴨志田 良和, 金田 憲二, 遠藤 敏夫, 田浦 健次朗, 近山 隆. 低負荷で多数の計算機をリアルタイムに監視するシステムVGXP の実装. 並列/分散/協調処理に関するサマーワークショップ(SWoPP2006), 電子情報通信学会コンピュータシステム研究会(CPSY), August 2006.
  • 合田憲人, 大澤清, 大角知孝, 笠井武史, 小野功, 實本英之, 松岡聡, 斎藤秀雄, 遠藤敏夫, 横山大作, 田浦健次朗, 近山隆, 田中良夫, 下坂久司, 梶原広輝, 廣安知之, 藤澤克樹. グリッドチャレンジテストベッドの構築と運用 〜グリチャレテストベッドの作り方〜 . 並列/分散/協調処理に関するサマーワークショップ(SWoPP2006), 情報処理学会研究報告, 2006-HPC-107, pp.49-54, July 2006.

    FY2005 and before

    Refereed Papers

  • Toshio Endo and Kenjiro Taura. Highly Latency Tolerant Gaussian Elimination. In Proceedings of IEEE/ACM International Workshop on Grid Computing (Grid2005), pp. 91--98, November 2005. [paper] [slides]
  • Toshio Endo, Kenji Kaneda, Kenjiro Taura and Akinori Yonezawa. High Performance LU Factorization for Non-dedicated Clusters. In Proceedings of IEEE/ACM International Symposium on Cluster Computing and the Grid (CCGrid2004), pp. 678--685, April 2004. [paper] [slides]
  • Kenjiro Taura, Toshio Endo, Kenji Kaneda, and Akinori Yonezawa. Phoenix : a Parallel Programming Model for Accommodating Dynamically Joining/Leaving Resources. In Proceedings of ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming (PPoPP '03), pp.216-229, June 2003.
  • Toshio Endo and Kenjiro Taura. Reducing Pause Time of Conservative Collectors. In Proceedings of ACM SIGPLAN International Symposium on Memory Management (ISMM2002), Berlin, pp.119-131, June 2002. [paper] [slides]
  • Toshio Endo, Kenjiro Taura and Akinori Yonezawa. Predicting Scalability of Parallel Garbage Collectors on Shared Memory Multiprocessors. In Proceedings of 15th IEEE International Parallel and Distributed Processing Symposium (IPDPS 2001), San Francisco, pp.1-6, April 2001. [paper]
  • Toshio Endo, Kenjiro Taura and Akinori Yonezawa. A Scalable Mark-Sweep Garbage Collector on Large-Scale Shared-Memory Machines. In Proceedings of ACM/IEEE Conference on Supercomputing (High Performance Networking and Computing) (SC97), San Jose, 14pages, November 1997. [paper]

    Theses for Degrees

  • Toshio Endo. Scalable Dynamic Memory Management Module on Shared Memory Multiprocessors. Ph.D Thesis, Department of Information Science, Faculty of Science, University of Tokyo. June 2001. [paper] [slides in japanese]
    NOTE: The paper is written in English, but title page and abstract page include Japanese characters.
  • Toshio Endo. A Scalable Mark-Sweep Garbage Collector on Large-Scale Shared-Memory Machines. Master thesis, Department of Information Science, The University of Tokyo, February 1998. [paper]
    NOTE: The paper is written in English, but title page and abstract page include Japanese characters.
  • Toshio Endo. A Methodology for Constructing a Portable Garbage Collector on Parallel Machines. Senior thesis, Department of Information Science, The University of Tokyo, February 1996.

    Posters

  • Kenjiro Taura, Kenji Kaneda, Toshio Endo, Daisaku Yokoyama, Yoshikazu Kamoshida, Takashi Chikayama, Akinori Yonezawa. Developing Grid Applications using Phoenix, IEEE/ACM Symposium on cluster computing and the Grid (CCGrid2003), posters & reseach demos session, May 2003.
  • Toshio Endo, Kenjiro Taura, Akinori Yonezawa. A Garbage Collector with Dynamic Load Balancing on Shared-Memory Machines and Its Evaluation. ACM SIGPLAN Conference on Programming Language Design & Implementation (PLDI'97), student poster session, May 1997.

    2005年度以前(日本語)

    論文誌

  • 白井 達也, 遠藤 敏夫, 田浦 健次朗, 近山 隆. 高いヒープ利用率の下で高速なインクリメンタルGC. 情報処理学会論文誌プログラミング, Vol.47, No.SIG 2 (PRO 28), pp.74-83, February 2006. [情報処理学会平成18年度論文賞受賞論文]
  • 遠藤 敏夫, 田浦 健次朗, 米澤 明憲. 共有メモリ並列計算機上の並列ガーベージコレクタの性能予測. 日本ソフトウェア科学会コンピュータソフトウェア, Vol.18, No.2, pp.54-58, March 2001.
  • 今井 健男, 山本 泰宇, 遠藤 敏夫, 田浦 健次朗, 米澤 明憲. DisC:ごみ集め機構を備えたC++の分散記憶並列拡張言語. 情報処理学会論文誌プログラミング, Vol.40, No.SIG 1 (PRO2), pp.42-56, February 1999.

    学会発表(査読あり)

  • 小林 義徳, 遠藤 敏夫, 田浦 健次朗, 米澤 明憲. マークスイープとコピーの混合による効率的なゴミ集め. 日本ソフトウェア科学会 プログラミングおよびプログラミング言語ワークショップ (PPL2003), March 2003. [paper]
  • 遠藤 敏夫, 田浦 健次朗, 米澤 明憲. 局所性を考慮した共有メモリ並列計算機上の並列BIBOP型メモリアロケータ. 情報処理学会 並列処理シンポジウム論文集 (JSPP 2001), pp.141-148, June 2001. [paper]
  • 大山 恵弘, 田浦 健次朗, 遠藤 敏夫, 米澤 明憲. 細粒度スレッド生成をサポートする言語の共有メモリ並列計算機上での実装とその性能評価. 日本ソフトウェア科学会 プログラミングおよび応用のシステムに関するワークショップ (SPA98), 1998.
  • 遠藤 敏夫, 田浦 健次朗, 米澤 明憲. 共有メモリ並列計算機のための負荷分散を行うガーベージコレクタとその評価. 日本ソフトウェア科学会 オブジェクト指向計算に関するワークショップ (WOOC97), 8pages, 1997.

    無査読論文

  • 遠藤 敏夫, 田浦 健次朗. 高い耐遅延性を持つガウス消去法. 並列/分散/協調処理に関するサマーワークショップ(SWoPP2005), 情報処理学会研究報告, 2005-HPC-106, pp.121-126, August 2005. [paper]
  • 白井 達也, 遠藤 敏夫, 田浦 健次朗, 近山 隆. 高いヒープ利用率の下で高速なインクリメンタルGC. 並列/分散/協調処理に関するサマーワークショップ(SWoPP2005), 情報処理学会プログラミング研究会, August 2005.
  • 遠藤 敏夫, 田浦 健次朗, 米澤 明憲. 共有メモリ並列計算機上の並列ガーベージコレクタの性能予測. 日本ソフトウェア科学会第17回大会論文集 (JSSST 2000), September 2000. [paper]
  • 遠藤 敏夫, 田浦 健次朗, 米澤 明憲. 大規模共有メモリ並列マシンにおけるスケーラブルなマークスイープ法ガーベージコレクタ. 日本ソフトウェア科学会第15回大会論文集 (JSSST 98), September 1998. [paper]
  • 遠藤 敏夫, 田浦 健次朗, 米澤 明憲. Portableでrobustなglobal garbage collectorの構築について. 並列/分散/協調処理に関するサマーワークショップ(SWoPP '96), 情報処理学会プログラミング研究会, August 1996. [paper]

    ポスター発表

  • 遠藤 敏夫, 田浦 健次朗. 高い耐遅延性を持つガウス消去法. 情報処理学会 先進的基盤システムシンポジウム (SACSIS2005), ポスターセッション, May 2005. [poster]
  • 白井 達也, 遠藤 敏夫, 田浦 健次朗, 近山 隆. 高いヒープ利用率のもとで高速なインクリメンタルGC. 情報処理学会 先進的基盤システムシンポジウム (SACSIS2005), ポスターセッション, May 2005.
  • 遠藤 敏夫, 田浦 健次朗. 停止時間の短い並行並列保守的ガーベージコレクタ. 情報処理学会 並列処理シンポジウム(JSPP2002), ポスターセッション, 2002.
  • 遠藤 敏夫, 田浦 健次朗, 米澤 明憲. アーキテクチャパラメータを利用した並列GCの性能予測. 日本ソフトウェア科学会 プログラミングおよび応用のシステムに関するワークショップ(SPA 2000), ポスターセッション, March 2000. [poster]

    その他の発表

  • 遠藤 敏夫. 大域分散環境に適した連立一次方程式の解法. 東京大学21世紀COE「情報科学技術戦略コア」 融合プロジェクトワークショップ, 2006年3月. [slides]
    Endo lab
    Endo's page