2015年11月に行われたSupercomputing '15会議の併設ワークショップESPM2 (International Workshop on Extreme Scale Programming Models and Middleware)にて、修士二年の辻田裕紀君が発表を行いました。
Yuki Tsujita, Toshio Endo, Katsuki Fujisawa: The Scalable Petascale Data-Driven Approach for the Cholesky Factorization with Multiple GPUs (slides)
九州大学藤澤克樹先生が中心に開発している数理問題最適化ソルバーSDPARAについて、数千基以上のGPUを使った際の性能をさらに向上させる改良を行いました。
コレスキー分解の計算部分を、データドリブン方式で行う・GPUとCPU間のデータ移動量を抑えた分散データ処理基盤を実装する・非同期ブロードキャスト相当の通信をスケーラブルに行うなどの工夫を行いました。これにより、TSUBAME2.5ほぼ全体の1360ノード・4080GPU上で1.775PFlopsを達成しました(世界記録更新!)

コメント