
拓海先生、この論文って一言で言うとどんな内容なんですか。ウチの電気代にも関係ありそうですか。

素晴らしい着眼点ですね、田中専務!この論文は、ドイツの主要なスーパーコンピューティングセンターが実際に行った省エネ運用の取り組みをまとめたものですよ。要点は、運用方針の変更とソフトウェア的な工夫で消費電力を現実に下げられる、という点です。大丈夫、一緒に整理していけば必ず分かりますよ。

具体的にはどんな手を打って、どれくらい減ったんですか。例えば投資に対しての効果が気になります。

良い質問です。論文の事例で、JSCのJUSUFシステムでは運用機能の追加で消費電力を約25%削減していますよ。投資はソフトウェア実装や運用ルールの整備が中心で、ハード刷新ほど大きくないので費用対効果は高いです。まずは低コストの運用改善から着手するのが現実的ですよ。

運用改善というのは具体的にどんなことをやるのですか。要するに〇〇ということ?

素晴らしい着眼点ですね!田中専務の仮説を受け止めると、それは半分正解で、半分補足が必要です。要点を三つに分けると、(1)使っていないノードの電源を落とす機能、(2)ノードの動作周波数をアプリに応じて下げる柔軟な設定、(3)ネットワーク配置を考えたジョブ割り当て(トポロジー認識スケジューリング)です。ですから「電力を使う時間を減らす」という考えは本質の一部ですが、ソフトウェアと運用の掛け合わせがポイントなんです。

ノードを落とすのは分かりますが、計算性能が落ちるんじゃないですか。ウチの現場でも影響が出ると困ります。

その懸念はもっともです。論文でも性能を落とさないことを重視していますよ。具体的にはユーザーが求める性能を満たす最小構成でノードの電力設定を可変にし、性能劣化が出ない範囲で周波数を下げる方式を採っています。まずは低リスクの試験運用で影響を測るのが良いですし、影響が少なければすぐに適用できますよ。

それならまずは試験運用で小さく始められそうですね。現場のコードも直さないといけないんですか。

現場のコード改修は効果が大きいですが、すぐに必要というわけではありません。論文ではユーザー支援と最適化ライブラリの提供で性能を維持しつつ効率を上げています。まずは運用側でスケジュールと電力設定を整え、並行して重要なアプリケーションに対して最適化支援を行うのが現実的ですよ。

なるほど。最後に、経営判断として覚えておくべきポイントを3つにまとめてもらえますか。投資判断に使いたいものでして。

素晴らしい着眼点ですね!要点は三つです。第一に、ソフトウェア的な運用改修で短期的に効果を出せること。第二に、ユーザー支援とコード最適化が中長期で効くこと。第三に、ネットワークやトポロジーを考慮したスケジューリングがシステム全体の効率を左右することです。大丈夫、一歩ずつ進めれば確実に効果が見えるんです。

分かりました。要はまずは運用の改善でコストを抑えつつ、影響が少ない部分からユーザー支援と最適化を進める、ということですね。自分の言葉でまとめるとそういうことです。
