スイスの視点を10言語で

ワクチンのスピード開発、人工知能が貢献

proteina modello
たんぱく質の性質はその立体構造によって決まる Laguna Design/Science Photo Library

効果の高い2種類の新型コロナウイルス感染症(COVID-19)ワクチンがこれだけ迅速に開発できたのは、人工知能(AI)や、スイスも含む世界中の研究者が進める革新的な共同研究の賜物だ。

人工知能(AI)には倫理的問題が存在する。しかし、AIは科学界に革命を起こし、現代の生物学が直面する最も複雑な問題を解決できる可能性を秘めている。

特に期待されるのは、未知のたんぱく質の構造を予測し、細胞の謎を解き、細胞に影響を与える病気をいち早く解明することだ。たんぱく質は近年、COVID-19ワクチンの新規開発で中心的な役割を果たすとして注目を浴びている。

だが実験を通してたんぱく質の構造を解明するのは、非常に長く手間のかかる作業だ。通常、研究には何カ月もかかり、多くのリソースを必要とする。新型のウイルス研究において、その性質を理解し効果的なワクチンを作るためには、ウイルスの構造情報が欠かせない。そこで研究者らは新たな計算手法を用いたアプローチによって解明プロセスを加速し、予測をより正確なものにした。

近年のAIのめざましい発展のおかげで、今では非常に複雑なたんぱく質でも、その立体構造を高精度で予測できるようになった。ロンドンに拠点を置くAI開発企業ディープマインド(米グーグルが2014年に買収)が開発したAIシステム「アルファフォールド2(AlphaFold2)」は、数カ月前までほとんど知られていなかった新型コロナウイルス(SARS-CoV-2)を構成する数種類のたんぱく質構造を、かなり短時間で特定するという偉業を成し遂げた。

科学の転換期

科学者のたゆまぬ努力や国際的な連携にAlphaFold2のような最先端のAI技術が加わり、パンデミックへの迅速な対応が可能になった。世界保健機関(WHO)外部リンクによると、昨年12月の時点で、臨床試験が行われているワクチン候補は最大60種類。そのうち3種類は既に一部の国の規制当局で承認された。

これは科学の転換期だと生物医学の研究者らは見る。バーゼル大学のトーステン・シュヴェーデ研究副部長は「信じられない成果だ」と語る。同氏はスイスバイオインフォマティクス研究所(SIB)の研究グループ長も務め、SIBが開発する完全自動のたんぱく質構造モデリングサーバー「SWISS-MODEL」は、世界中の研究者に利用されている。

SF映画のような現実

なぜ、たんぱく質が医学や科学の分野で主要な役割を果たすのか?それは人間の細胞やあらゆる生物の化学的・生物学的プロセスを支えているのが、この小さく、非常に重要なたんぱく質だからだ。たんぱく質を構成するアミノ酸は、結合して自発的な「折り紙」を形成し、独自の立体構造を決定する。その構造の解明は、ヒトの病気といった生物医学における研究で大いに役立つ。科学界がディープマインド社の成果を「革命的」と称賛するのはそのためだ。この成果は、新薬や高度な薬学的治療法の開発につながることが期待される。

SWISS-MODELは、実験上まだ発見されていないたんぱく質の三次構造を自律的にモデル化できる世界初の自動ソフトだ。バイオインフォマティシャンでSWISS-MODELの創始者、マヌエル・パイチ氏は1993年、たんぱく質の構造情報を得るために人間の介入を必要としないコンピュータシミュレーションを用い、分子機能の理解を深めるという方法を打ち出した。

これは当時、まるでSF映画のような話だった。だが今日では、既知のたんぱく質構造と未知のたんぱく質の配列を比較する「ホモロジーモデリング」を使ったこの自動ソフトは、既に精度も性能も人間の能力を超え、世界中で利用されている。SWISS-MODELは、年間100万件以上のたんぱく質モデルの依頼を人間の監督なしで処理する。

たんぱく質は柔軟性のある物体で、機能するためにはときどき移動する必要がある。たんぱく質の3次元モデルと実験的な参照モデルを比較するには、最適な重なりが得られるまでモデルを「回転」させなければならない。

しかし、柔軟性のある物体の場合、このオーバーラップを実現するのは難しい。この問題を解決するため、SWISS-MODELチームは「ローカル・ディスタンス・ディファレンス・テスト」(LDDT)と呼ばれるスコアを開発。たんぱく質の動きに関係なく、たんぱく質がモデル構造とどの程度重なるかを評価・予測できるようにした。このように人の手を介さずに利用できるスコアは、自律的なたんぱく質モデリング手法の開発には不可欠だ。

人間を超えるソフトウェア

過去30年間、研究者らはアミノ酸の配列からたんぱく質の特徴的な立体構造を割り出そうと試みてきた。このアプローチでは、関連するたんぱく質の実験的な構造が分かれば比較的容易かつ正確にモデリングできる。しかし同じ系統のたんぱく質の構造情報がない場合、非常に複雑で不正確な予測をゼロから行わなければならないことが多い。AlphaFold2は、この問題を過去のものにした。

「ディープマインド社のAlphaFold2は、簡単なケースでも非常に難しいケースでも機能すると分かった。これは非常に画期的だ。これまでたんぱく質モデリングに精通する人間でも出来なかったことを、AIは可能にした」とシュヴェーデ氏は高く評価する。

ディープマインド社のAIシステムAlphaFold2は、ディープニューラルネットワークと呼ばれる高度な機械学習技術を使って、たんぱく質の遺伝子配列から直接たんぱく質の構造を予測する。そのためにAIはまず、科学界で公開されている実験データの中から約10万個の既知のたんぱく質の配列と構造を学習。これにより、あらゆるたんぱく質の3次元モデルを高精度で予測できるようになった。たんぱく質の構造予測技術を評価する、たんぱく質構造予測技術評価(CASP)会議外部リンクの主催者も、ディープマインド社の驚異的な成果を認め、その計算能力と予測結果は「前人未到」と高く評価している。

たんぱく質構造予測技術評価(CASP)は2年に1度行われる実験で、たんぱく質構造予測分野の開発状況を国際的に評価する。2020年に行われた今回の実験(CASP14)では、100種類近くのたんぱく質を対象に予測手法の精度を評価。新型コロナウイルス(SARS-CoV-2)が生産する未知のたんぱく質「ORF8」のような複雑なケースでも、AIシステム「AlphaFold2」は極めて正確に予測可能なことが示された。SARS-CoV-2は約30種類のたんぱく質で構成されるが、そのうち十数種類のたんぱく質はまだ十分に理解されていない。

進歩をもたらす黄金律

ディープマインドが成功した背景には、科学界の強力なサポートや、SWISS-MODELも貢献する計算構造生物学の分野でのオープンな情報交換がある。前出のシュヴェーデ氏は、計算手法と構造データをオープンに共有したおかげで、ディープマインド社は必要な情報にアクセスでき、バイオインフォマティクスで最も困難な問題の1つを解決できたと言う。

パンデミックはこのような情報交換をさらに活性化し、短期間で確実な成果を得るためには協調が欠かせないことを実証した。

「このパンデミックで我々は多くのことを学んだ。SARS-CoV-2に関する情報を科学界でオープンに共有したおかげで、記録的なスピードでワクチンを開発できた」と同氏は付け加え、情報を共有せず連携しないサイロ化が科学的成果にとっていかに逆効果であるかを証明していると指摘した。

(英語からの翻訳・シュミット一恵)

swissinfo.chの記者との意見交換は、こちらからアクセスしてください。

他のトピックを議論したい、あるいは記事の誤記に関しては、japanese@swissinfo.ch までご連絡ください。

SWI swissinfo.ch スイス公共放送協会の国際部

SWI swissinfo.ch スイス公共放送協会の国際部