
「アルコールを分解するタンパク質を作って」。たった一言でAIが生命の設計図を描き上げる。そんな未来がすでに現実となっています。ChatGPTのような会話型AIの技術が生命科学の世界に応用され、研究者たちは専門知識なしに新しいタンパク質を設計できるようになりました。
ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
ボタンから募集中の求人一覧ページに移動できます。
「言葉だけで生命を設計する」新しいAIの正体

中国の西湖大学の袁発杰氏が率いるチームが開発したPinal(パイナル)は、まるで友人との会話のように自然な言葉でタンパク質を設計できるAIです。従来のタンパク質設計ツールが複雑なコードや専門的な構造データを要求していたのとは対照的に、Pinalは驚くほどシンプルなアプローチを採用しています。実際の使用例を見てみましょう。「アルコール脱水素酵素を設計してください」という一文を入力するだけで、AIが自動的に機能するタンパク質の設計図を作り上げます。アルコール脱水素酵素とは、体内でアルコールを分解する働きを持つタンパク質のことです。この技術の実力は実験結果が物語っています。Pinalが設計した1,600以上の候補から選ばれた8つのタンパク質のうち、なんと2つが生きた細胞の中で実際にアルコールを分解することに成功しました。一部は人間の体温で機能し、別のものは高温の158度で活性を示したのです。袁氏は『Nature』誌に対し「テキストのみを使用して機能的な酵素を設計したのは我々が初めてです」と語っています。
Pinalの背景には16億のパラメータ—AIの内部で情報を処理する接続点—が働いており、2段階のプロセスで動作します。まず入力された文章を構造要素やトークンに変換し、次にSaProtという専用モデルがユーザーの要求に最も適したタンパク質配列を生成するのです。既存の高性能タンパク質設計AI「ESM3」との比較テストでは、Pinalの圧倒的な優位性が明らかになりました。Pinalで作られたタンパク質の半数が予測通りの機能を発揮したのに対し、ESM3では約10%にとどまったのです。より複雑なプロンプトでは、抗生物質や細胞の感染回復を助けるタンパク質の候補も生成されています。
しかし、なぜここまで画期的な技術が今この瞬間に必要とされているのでしょうか。
なぜ今、タンパク質設計にテキスト入力が必要だったのか

答えはタンパク質設計が抱えてきた根深い問題にあります。タンパク質は生命活動の基盤となる分子で、私たちの体を形作り、代謝を支え、多くの薬の標的にもなっています。20種類のアミノ酸が文字のように連なり、その配列が最終的な3D構造と機能を決定する仕組みです。
従来の手法では、既存のタンパク質を特定の用途に合わせて改造する方法が主流でした。しかし研究チームが指摘するように、これらは「既存のタンパク質テンプレートと自然の進化的制約への依存によって制限されている」状況でした。つまり、自然界にすでに存在する構造の枠組みから抜け出せないため、本当に新しい機能を持つタンパク質を生み出すことは困難だったのです。この壁を突破するために登場したのが、タンパク質言語モデルという新しいアプローチでした。ChatGPTが文章を学習するように、これらのAIはタンパク質の配列と構造を大量に学習します。EvolutionaryScaleのESM3は、27億を超えるタンパク質のデータで訓練されており、既にウイルス攻撃を撃退する抗体や新しい遺伝子編集ツールの設計に使われています。
ところが、ここに新たな課題が生まれました。これらの高性能なAIは使いこなすのに深い専門知識が必要で、一般的な研究者には敷居が高すぎたのです。まるで高性能なスポーツカーを運転するのにレーシングドライバーの技術が必要なようなものでした。研究チームはこの問題を「手動の構造仕様を回避する」ことで解決しようと考えました。彼らは既存のタンパク質データベースに大規模言語モデルを使って説明文を付け、17億のタンパク質-テキストペアという巨大なデータセットを作成したのです。
技術的な観点から見ると、単純にアミノ酸配列を直接生成する方法では、AIが膨大な可能性の中で迷ってしまい、実際に機能するタンパク質を見つけるのが困難になります。そこでPinalは、まずタンパク質の3D構造を予測し、その後で最適な配列を決める2段階アプローチを採用しています。これは建築でいえば、材料を適当に並べるのではなく、まず設計図を描いてから建設を始めるのと同じ発想です。
興味深いことに、現在スタートアップの310 AIも「MP4」という類似のAIを開発しており、心疾患に応用できる可能性があると発表しています。ただし、ChatGPTが時折不正確な情報を生成するように、タンパク質言語モデルも信頼性に欠ける配列や反復的な結果を作ることがあります。プロンプトの表現方法も最終結果に影響するため、生成されたタンパク質は他の方法で検証する必要があるのが現状です。
まとめ

いかがだったでしょうか?
Pinalのようなテキスト入力型タンパク質設計AIは、生命科学の研究手法を大きく変える可能性を秘めています。専門知識の壁を取り払い、研究者が自然な言葉で新しいタンパク質を設計できる時代の扉が開かれました。現段階では生成結果の検証が不可欠ですが、この技術が医薬品開発や環境問題の解決にどのような影響を与えるかは、今後の研究成果次第といえるでしょう。研究チームが「まるでサイエンスフィクションのよう」と表現したこの技術が、私たちの生活をどう変えていくのか、その答えはもうすぐそこまで来ているのかもしれません。
参考記事:ChatGPT for Biology: A New AI Whips Up Designer Proteins With Only a Text Prompt
ARCHETYP Staffingではクリエイターを募集しています!
私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!
ボタンから募集中の求人一覧ページに移動できます。