活性化スパース性を用いた汎用大規模言語モデルの圧縮機会(Activation Sparsity Opportunities for Compressing General Large Language Models)
田中専務拓海さん、最近部下から「大きな言語モデルを現場で動かせるようにしよう」と言われて頭が痛いんですが、そもそも何が問題で、何を改善する論文なんでしょうか。AIメンター拓海素晴らしい着眼点ですね!大雑把に言えば、この論文は「モデルの内部でほとんど使われていない部分を見つけて、メモリや計