2014年6月24日
独立行政法人理化学研究所
国立大学法人東京工業大学
ユニバーシティ・カレッジ・ダブリン
独立行政法人科学技術振興機構
スーパーコンピュータ「京」がGraph500で世界第1位を獲得
-ビッグデータの処理で重要となるグラフ解析でも最高の評価-
理化学研究所(野依良治理事長)と東京工業大学(三島良直学長)、およびアイルランドのユニバーシティ・カレッジ・ダブリン(Andrew J Deeks学長)は、大規模グラフ解析(互いに関連性のある複雑なデータの分析)に関するスーパーコンピュータの国際的な性能ランキングであるGraph500※において、スーパーコンピュータ「京(けい)」[1]による解析結果で第1位を獲得しました。これは、東京工業大学博士課程(理化学研究所研修生)の上野晃司氏らによる成果です。
大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析において重要となるもので、今回のランキング結果は、「京」がビッグデータ解析に関する高い能力を有することを実証するものです。
※)ドイツのライプツィヒで開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際会議「International Supercomputing Conference(ISC) 2014」で6月23日(日本時間6月24日)に発表。前回(2013年11月)のランキングでは、「京」は第4位。
Graph500上位10位
本日公開されたGraph500の上位10位は以下の通りです。
左右にスクロールできます
順位 | システム 名称 |
設置場所 | ベンダー | 国名 | ノード数 | プログラム スケール |
GTEPS |
---|---|---|---|---|---|---|---|
1 | K computer | 理研 計算科学研究機構 | 富士通 | 日 | 65536 | 40 | 17977 |
2 | Sequoia | ローレンス・リバモア研 | IBM | 米 | 65536 | 40 | 16599 |
3 | Mira | アルゴンヌ研 | IBM | 米 | 49152 | 40 | 14328 |
4 | JUQUEEN | ユーリッヒ研 | IBM | 独 | 16384 | 38 | 5848 |
5 | Fermi | CINECA | IBM | 伊 | 8192 | 37 | 2567 |
6 | 天河2A | 国防科学技術大学 | NUDT | 中 | 8192 | 36 | 2061 |
7 | Turing | GENCI | IBM | 仏 | 4096 | 36 | 1427 |
7 | Blue Joule | ダーズベリー研 | IBM | 英 | 4096 | 36 | 1427 |
7 | DIRAC | エジンバラ大学 | IBM | 英 | 4096 | 36 | 1427 |
7 | Zumbrota | EDF社 | IBM | 仏 | 4096 | 36 | 1427 |
7 | Avoca | ビクトリア州生命科学計算イニシアティブ | IBM | 豪 | 4096 | 36 | 1427 |
Graph500とは
近年活発に行われるようになってきた実社会における複雑な現象の分析では、多くの場合、分析対象は大規模なグラフ(節と枝によるデータ間の関連性を示したもの)として表現され、それに対するコンピュータによる高速な解析が必要とされています。例えば、インターネット上のソーシャルサービスなどでは、「誰が誰とつながっているか」といった関連性のある大量のデータを解析するときにグラフ解析が使われます。また、サイバーセキュリティや金融取引の安全性担保などのためにもグラフ解析が使われています。このような社会的課題に限らず、脳神経科学における神経機能の解析やタンパク質の相互作用分析などの科学分野においてもグラフ解析が用いられ、応用範囲が大きく広がっています。こうしたグラフ解析の性能を競うのが、2010年から開始されたスパコンランキング「Graph500」です。
TOP500[2]においては、「京」は2011年(6月、11月)に第1位、その後、2013年(6月、11月)は第4位になりました。2014年6月23日に公表された最新のランキングでも引き続き第4位に位置付けています。
TOP500では、規則的な行列演算である連立一次方程式を解く計算速度(LINPACK[3])でスーパーコンピュータを評価していますが、Graph500ではグラフの幅優先探索(1秒間にグラフのたどった枝の数(Traversed Edges Per Second;TEPS))という複雑な計算を行う速度で評価されており、計算速度だけでなく、アルゴリズムやプログラムを含めた総合的な能力が求められています。
今回Graph500の測定に使われたのは、「京」が持つ88,128台のノード[4]の内の65,536台で、約1兆頂点、16兆枝から成る大規模グラフに対する幅優先探索問題を0.98秒で解くことに成功しました。ベンチマークのスコアは17,977GTEPS(ギガテップス)です。Graph500第1位獲得は、「京」が科学技術計算でよく使われる規則的な行列演算によるだけでなく、不規則な計算が大半を占めるグラフ解析においても高い能力を有していることを実証したものであり、幅広い分野のアプリケーションに対応できる「京」の汎用性の高さを示すものです。また、それと同時に、高いハードウェアの性能を最大限に活用できる研究チームの高度なソフトウェア技術を示すものと言えます。「京」はこれまでも5,524GTEPSの性能を達成しており、第4位に位置づけられていましたが、今回「ポストペタスケールシステムにおける超大規模グラフ最適化基盤プロジェクト」研究チームによってアルゴリズムおよびプログラムの改良が行われ、大幅な性能向上を達成することができました。
今後の展望
大規模グラフ解析においては、アルゴリズムおよびプログラムの開発・実装によって今回のように性能が飛躍的に向上する可能性を示しており、今後も更なる性能向上を目指していきます。また、上記で述べた実社会の課題解決および科学分野の基盤技術へ貢献すべく、スーパーコンピュータ上でさまざまな大規模グラフ解析アルゴリズムおよびプログラムを研究開発していきます。
なお、本研究の一部は、科学技術振興機構(JST)戦略的創造研究推進事業CREST「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出」(研究総括:米澤 明憲(独立行政法人理化学研究所 計算科学研究機構))における研究課題「ポストペタスケールシステムにおける超大規模グラフ最適化基盤」(研究代表者:藤澤 克樹 九州大学、 共同研究者:鈴村 豊太郎 ユニバーシティ・カレッジ・ダブリン)および「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」(研究総括:喜連川 優(国立情報学研究所))における研究課題「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術」(研究代表者:松岡 聡 東京工業大学)の一環として行われました。
関連サイト
問い合わせ先
独立行政法人理化学研究所
計算科学研究機構 広報国際室
担当 干場 真弓
Tel: 078-940-5623 / Fax: 078-304-4964
aics-koho [at] riken.jp
※[at]は@に置き換えてください。
報道担当
独立行政法人理化学研究所 広報室 報道担当
Tel: 048-467-9272 / Fax: 048-462-4715
国立大学法人東京工業大学 広報センター
Tel: 03-5734-2975 / Fax: 03-5734-3661
独立行政法人科学技術振興機構 広報課
Tel: 03-5214-8404 / Fax: 03-5214-8432
補足説明
- 1.
- スーパーコンピュータ「京(けい)」
-
文部科学省が推進する「革新的ハイパフォーマンス・コンピューティング・インフラ(HPCI)の構築」プログラムの中核システムとして、理化学研究所と富士通が共同で開発を行い、2012年に共用を開始した計算速度10ペタフロップス級のスーパーコンピュータ。「京(けい)」は理化学研究所の登録商標で、10ペタ(10の16乗)を表す万進法の単位であるとともに、この漢字の本義が大きな門を表すことを踏まえ、「計算科学の新たな門」という期待も込められている。
- 2.
- TOP500
-
TOP500は、世界で最も高速なコンピュータシステムの上位500位までを定期的にランク付けし、評価するプロジェクト。1993年に発足し、スーパーコンピュータのリストを年2回(6月、11月)発表している。
- 3.
- LINPACK
-
米国のテネシー大学のJ. Dongarra博士によって開発された規則的な行列計算による連立一次方程式の解法プログラムで、TOP500リストを作成するために用いるベンチマーク・プログラム。ハードウェアのピーク性能に近い性能を出しやすく、その計算は単純だが、応用範囲が広い。
- 4.
- ノード
-
スーパーコンピュータにおけるオペレーティングシステム(OS)が動作できる最小の計算資源の単位。「京」の場合は、ひとつのCPU(中央演算装置)、ひとつのICC(インターコネクトコントローラ)、および16GBのメモリから構成される。