
拓海先生、最近の論文で『CodonMPNN』という名前を見かけましたが、要するにどんな話なのか教えてください。うちの現場にどう関係するのかイメージできていません。

素晴らしい着眼点ですね!大丈夫です。一言で言えば、タンパク質を設計するAIが作ったアミノ酸配列を、そのまま発現するためのDNA配列(コドン配列)に最適化して出力できるモデルです。実務での効果は主に発現量の改善にありますよ。

うーん、それでも少し抽象的です。要は設計したタンパク質をつくるときに『どのコドンを使うか』を決める部分を賢くするということですか。

その通りです。もう少し噛み砕くと、同じアミノ酸をコードするコドン(3文字のDNA配列)は複数種類あり、宿主生物ごとに使いやすいコドンが異なるのです。CodonMPNNは設計されたタンパク質の立体構造と、使う生物を入力にして最適なコドン列を直接生成できます。

これって要するに発現効率のために『現場(宿主)に合わせた翻訳の言葉づかい』を自動で選ぶということ?

まさにそのイメージです。要点は三つ。1つ目、構造(立体形状)を条件に取るので設計したタンパク質に直接対応できること。2つ目、宿主ラベルを入れることで生物特異的なコドン選択が可能なこと。3つ目、従来の手作業的な最適化ルールよりも、生成モデルが自然配列に近い最適解を学習できる可能性があることです。

それで現場の負担は減るのですか。うちの工場では遺伝子合成業者に頼んで調整してもらっていますが、それを置き換えられるのか心配です。



