サーバーレス環境におけるMixture-of-Expertsモデル推論の分散デプロイ最適化(Optimizing Distributed Deployment of Mixture-of-Experts Model Inference in Serverless Computing)
田中専務拓海先生、最近部下から「サーバーレスで大きなAIモデルを安く回せるらしい」と聞きました。うちの現場でもコストを下げられるか知りたいのですが、何をどう最適化すればいいのですか。AIメンター拓海素晴らしい着眼点ですね!要点を先に三つに絞ると、第一に「どの専門家(expert)がよく使