2021年6月、スーパーコンピュータ「富岳」は、半年に一度発表される性能ランキングのうち4部門で、3期連続の世界第1位を獲得しました。2020年11月には人工知能(AI)に特化したランキングでも好成績を収めています。それぞれのランキングは、「富岳」のどのような性能を示しているのでしょうか。今村俊幸チームリーダー(TL)と佐藤賢斗TLに聞きました。
スーパーコンピュータ「富岳」
今村 俊幸(いまむら としゆき)(写真左)
チームリーダー
1969年愛知県生まれ。京都大学大学院工学研究科応用システム科学専攻単位取得退学。博士(工学)。日本原子力研究所計算科学技術推進センター 研究員、電気通信大学 准教授などを経て、2012年より理研計算科学研究機構 大規模並列数値計算技術研究チーム チームリーダー。2018年より現職。
佐藤 賢斗(さとう けんと)(写真右)
チームリーダー
1984年神奈川県生まれ。東京工業大学大学院数理計算科学専攻博士課程修了。博士(理学)。同大学学術国際情報基盤センター研究員、米国ローレンスリバモア国立研究所 研究員などを経て2018年より現職。
計算の速さのランキング
スパコンの性能はスパコンのハードウェアが進歩し、スパコンの使用場面が広がるにつれてさまざまな角度から評価されるようになった。「富岳」が1位を獲得した4つのランキング(図1)のほか、省エネ性能を競うランキング、さらにいくつか試行段階のランキングもある。
左右にスクロールできます
名称 | 概要 | 開始年 |
---|---|---|
TOP500 | 膨大な数の未知数を含む連立一次方程式を解く速さを競う。解き方は決まっており、HPLと呼ばれるプログラムが使われる。 | 1993年 |
Graph500 | グラフを解析する性能のランキング。グラフの一つの頂点からほかのすべての頂点に到達する経路を見つけるのにかかる時間を競う。 | 2010年 |
HPCG | TOP500とは異なるタイプの連立一次方程式をTOP500とは異なる解き方で解く速さを競う。 | 2014年 |
HPL-AI | TOP500と同じ連立一次方程式を解くが、TOP500では64ビットで表した数値を使って計算することが定められているのに対し、32ビットや16ビットの数値を使ってもよいとして計算の速さを競う。 | 2019年 |
MLPerf HPC | 上の四つのような性能テストではなく、実際に研究に使うディープラーニングのプログラムを実行するのにかかる時間を競う。 | 試行段階 |
ランキングとして最初に登場したTOP500は、決まった問題を決まったプログラムで解いて計算の速さを純粋に競う。一般に、ランキングでは問題が与えられ、それを解くためのプログラムをつくるが、TOP500の問題ではすでにHPLというプログラムが確立されている。解く対象は連立一次方程式(図2)。なぜかというと、スパコンではさまざまな方程式を解く際に、そのままでは解けないため数学的に変形して連立一次方程式にするからだ。連立一次方程式は四則演算を駆使すれば解くことができる。このランキングで、「富岳」は2位のスパコンの3倍近い計算速度を達成して1位となった。「TOP500では数時間も計算を続けるので、1位となったことは『富岳』が速いだけでなく長時間安定して稼働できることの現れでもあります」と、今村TLは解説する。
図2 連立一次方程式
x1、x2などを未知数、a11、a12などを係数、b1、b2などを定数項と呼ぶ。TOP500では係数がどれもゼロではない連立一次方程式を解くのに対し、HPCGでは係数の多くがゼロである連立一次方程式を解き、解き方もTOP500とは異なる。
しかし、TOP500は発表が始まってから年数を経るにつれ、「問題の内容がスパコンで実際に行われる計算とかけ離れ、スパコンのハードウェアの進歩にも対応していない」と指摘されるようになった。こうした指摘に応えて2014年に開始されたのがHPCGである。HPCGの問題はスパコンの重要な用途であるシミュレーションの性能を評価するのに適している。シミュレーションとは法則に基づく計算により未来を予測するもので、例えば天気予報には大気の運動法則に基づいたシミュレーションが利用されている。シミュレーションの際にも連立一次方程式を解くのだが、そのタイプはTOP500と異なり解き方も違う。HPCGはこのような計算に焦点を当てており、1位になったことは「富岳」のシミュレーション性能の高さを示す。その性能は新型コロナウイルス関連のシミュレーションでも遺憾なく発揮されている。
社会現象もスパコンで解析
2010年に登場したGraph500は、少し毛色が違う。グラフとは一般に、頂点と辺でデータ間の関係を表すものだ(図3)。現代社会で起こる現象には巨大なグラフで表せるようなものが増えている。「例えば、SNSにおける人と人とのつながりはグラフで表せます」と佐藤TL。そして、そのグラフを解析すると中心にいるのはAさんだとか、BさんとCさんの距離は近いといったことが分かり、「Dさんは知り合いではありませんか?」といった提案も可能になる。こうしたグラフの解析がスパコンの重要な用途の一つとなってきたため、その性能を比べるGraph500が登場したのだ。「富岳」は、1兆個以上の頂点をもつグラフの解析で圧倒的な性能を示し1位となった。
図3 グラフ
このグラフはごく簡単なものだが、SNS内の人のつながりなどの社会現象は、多数の頂点を多数の辺でつないだ巨大なグラフとなる。グラフのある頂点と別の頂点の間につながりがあるかどうか、ある頂点から別の頂点までの距離はどのぐらいかなどを解析することにより社会現象の特徴を抽出できる。
AI時代のランキング
今村TLはHPL-AIを担当した。佐藤TLには2020年に試行が始まったMLPerf HPCに関して話を伺った。この二つはAIで画像を認識するときによく使われるディープラーニングの手法と関係が深い。
HPL-AIは、数値の桁数を減らして計算したときの計算速度を競うものだ。スパコンでもパソコンでもコンピュータが扱える数値の桁数はあらかじめ決まっており、最近のスパコンでは64ビットが標準となっている。ビットとは、大まかに言うと数値を二進数で表した場合の1桁のことで、64ビットは十進数では16桁程度にあたる。計算に使う数値の桁数が多ければ計算結果の精度は上がる。しかし、ディープラーニングの計算では、それほど精度を要求されない部分もあるため、そういう部分では桁数を減らして計算し、計算時間を短くすることが多い。また、最近のAI用途に特化したコンピュータは少ない桁数での計算が強化されている。こうした背景から提案されたのが、HPL-AIのランキングだ。
桁数を減らした計算は簡単そうに思えるが、そうではない。8桁しかない電卓で8桁×8桁の計算をするとエラーが出るように、桁数が少ないと計算はすぐに破綻してしまう。「HPL-AIで解く問題はTOP500と同じなので、すでに確立されているHPLを改良しようと思ったのですが、それではうまくいかず、結局、自分たちでプログラムを一から書きました」と、今村TLは苦労を振り返る。
これまでの四つのランキングは、性能を測るための専用の問題で能力を競うものだったが、佐藤TLが担当したMLPerf HPCでは、宇宙論と異常気象の研究に実際に使われるプログラムの実行にかかる時間を競う。「富岳」が参加したのは宇宙論のプログラム(CosmoFlow)で、ディープラーニングにより宇宙の構造の3次元像をたくさん学習するものだ。
一般に、ディープラーニングのような大規模なプログラムは、基本的な計算を行うルーチン的なプログラム(これを「カーネル」と呼ぶ)を駆使して実行される。このため、プログラムを速く実行するにはカーネルがスパコンのハードウェアをうまく使いこなす能力を持ち、計算を速く実行できる必要がある。しかし、これまで、「富岳」のハードウェアに適したディープラーニング向けのカーネルは存在しなかった。そこで、別のスパコン用のカーネルを「富岳」に合わせて改良することにした。「富岳」を共同開発した富士通株式会社のチームの努力で改良は成功し、「富岳」は2020年11月のランキングで日本の別のスパコンに次いで2位となった。「今回改良したカーネルは学習する対象が違っても使えるので、今後、『富岳』でディープラーニングの計算をするときに活躍すると思います」と、佐藤TLはランキングに参加した意義を語る。
着眼点の異なる4つのランキングで1位を獲得し、AI時代に向けてのステップアップも達成して総合的な実力の高さを示した「富岳」。今後は、日本が目指すSociety 5.0の実現に貢献すると期待されている。
(取材・構成:青山聖子/制作協力:サイテック・コミュニケーションズ)
関連リンク
- 2021年6月28日お知らせ「スーパーコンピュータ「富岳」TOP500、HPCG、HPL-AIにおいて3期連続の世界第1位を獲得」
- 2021年6月28日お知らせ「スーパーコンピュータ「富岳」がGraph500において3期連続で世界第1位を獲得」
- 2020年11月19日お知らせ「機械学習処理ベンチマークMLPerf HPCにて最高レベルの速度を達成-日本のスーパーコンピュータシステムで計測したアプリケーション性能が上位を独占-」
この記事の評価を5段階でご回答ください