
拓海先生、最近うちの部下が「PIMってのを入れれば推奨システムが速くなる」と騒いでましてね。正直、PIMという概念からして私には霧の中でして、これって本当に現場で使えるのでしょうか。

素晴らしい着眼点ですね!Processing-In-Memory (PIM)(メモリ内処理)は、データをわざわざメモリと演算部で行き来させないで済む仕組みで、データ移動を減らして電力と速度を改善できるんですよ。大丈夫、一緒に整理していけば導入可能な判断ができますよ。

なるほど。ただうちの推奨システムはDeep Neural Networks (DNN)(深層ニューラルネットワーク)を使っているのですが、PIMはどの程度互換性があるのですか。投資対効果を説明してもらわないと動けません。

良い視点ですね。AutoRACという研究は、DNNの設計とPIMのハードウェア設計を同時に探索することで、性能と効率を最大化するアプローチを示していますよ。要点を3つで言うと、1) モデル側とハード側を一緒に最適化する、2) PIM向けの設計空間を形式化する、3) 実行効率で大きな改善を確認した、という点です。大丈夫、投資対効果の視点で説明できますよ。

これって要するに、ソフト屋とハード屋が別々に最適化するんじゃなくて、両方を一緒に設計して効率を取るということですか?

その通りです!まさにHardware-Software Co-design(ハードウェア・ソフトウェア協調設計)で、別々に最適化するとどうしても食い違いが出て無駄が生じるんです。AutoRACは設計空間を自動で探索して、推奨モデルの構造とPIMのパラメータを同時に決めることで効率を出していますよ。

具体的にはどれくらいの効果が見込めるんですか。うちの工場のサーバを入れ替えるとしたら、どの指標を見れば良いですか。

良い質問です。論文では、AutoRACで探索された設計は、ナイーブな割り当てや手作り設計に比べて最大で3.4倍の速度、約1.7倍のシリコン面積削減、12.5倍の電力効率向上を示しています。工場で見るべき指標はレーテンシ(推奨の応答時間)、スループット、消費電力、そしてシステムコストですよ。これらをトレードオフしながら最適解を選べるのが強みです。

導入リスクや実装の手間も気になります。現場のエンジニアが扱える形で出てくるんでしょうか。うちの部下はクラウドよりオンプレを好みますので、その点も知りたいです。

導入の現実的なハードルも論文は扱っていますよ。重要なのは三つで、1) 設計探索はシミュレーションベースで行われるため試作前に評価できる、2) PIMのターゲットにはReRAM(Resistive Random-Access Memory)などの非揮発メモリが含まれ、既存のオンプレ環境への適応が考慮される、3) ソフトウェア側はモデルの量子化やマッピングルールが生成されるため現場での適用負荷を下げられる、という点です。大丈夫、手順を示せば現場導入は進められるんです。

わかりました。では一旦私の言葉で整理しますと、AutoRACは「推奨システム向けのDNN設計とメモリ内処理向けハード設計を同時に探索して、速度と電力の最適な組合せを自動で提案する仕組み」という理解で合ってますか。

その理解で完璧ですよ、田中専務。いいまとめです。これなら部下の方にも説明できますよね。一緒に計画を作っていけば必ず実行可能ですから、大丈夫ですよ。


