多くのバイオ研究者の長きにわたる努力や叡智によって蓄積されてきたバイオ領域の学問。しかし、生命の森羅万象はまだ未知の領域が多く、研究によってさらなる解き明かしが必要となります。
そんなバイオ領域をさらなる高みに導く可能性があるのが、「バイオインフォマティクス」です。「情報生命科学」とも訳される学問領域がなぜ注目されているのか、未来を担う学問として期待されるバイオインフォマティクスの詳細に迫ります。
監修者プロフィール
バイオインフォマティクスとは、バイオ(生物学)にインフォマティクス(情報学)を組み合わせた学問です。日本語では「情報生命科学」や「生命情報科学」とも訳され、生命現象をコンピューターを使って解析、研究する最先端の領域と言えます。
「バイオインフォマティクス」という言葉が最初に使われたのは1970年にさかのぼるとも言われていますが、一般的に広く知られるようになったのは「ヒトゲノム計画」がきっかけです。
ヒトゲノム計画は、1990年に米国を中心に進められた国際共同研究で、3000億円もの膨大な費用と10年以上の歳月をかけて、ヒト一人分のDNA情報を網羅しようというものでした。しかし、その後、2000年代に次世代シーケンサーという装置の飛躍的発展とともに、現在ではヒト一人分はたった1日で、費用も約十万円以下でDNA情報を把握できるようになりました。この事実だけ見ても、この数十年でバイオインフォマティクスが急速に進歩したことが分かるでしょう。
生物の遺伝情報はDNAに記載され、その情報がmRNAに転写され、タンパク質に翻訳(合成)されることで機能を発現します。そして、DNA、RNA、タンパク質の化学構造は文字列として表現され、各データは配列と呼ばれます。バイオインフォマティクスはこれらの遺伝情報を収集、解析、研究し、さらに後述するDNAデータバンクに格納することで、世界中の研究者の間で共有されています。
一口にバイオインフォマティクスと言っても、研究は多岐に渡る領域で実施されています。特定非営利活動法人「日本バイオインフォマティクス学会」によると、以下6つの研究がバイオインフォマティクスで進められています。
①ゲノム(遺伝子・DNA)データ解析による病気のメカニズム解明
②タンパク質の形や動きの調査による治療薬開発
③コンピューターの中で生命のネットワークやシステムのシミュレーション
④環境汚染物質を分解する生物や、有用な物質を作り出す生物の発見
⑤地球上の生命のはるかな進化の歴史やロマンを解明
⑥研究に必要な新しいソフトウェア・情報技術の開発
出典:特定非営利活動法人 日本バイオインフォマティクス学会「バイオインフォマティクスについて」
具体的な活用事例をいくつか紹介します。
例えば、「①ゲノム(遺伝子・DNA)データ解析による病気のメカニズム解明」に関しては、アルツハイマー病のメカニズムの解明が挙げられます。アルツハイマー病が進行し、最終的に認知症になるまでには「老人斑」と呼ばれる、加齢に伴って脳に見られるタンパク質の沈着が、脳内に作られることが知られています。この老人斑が溜まると細胞が死んでいく「神経原繊維変化」という脳が萎縮して認知症になるプロセスが進行しますが、どのように老人斑ができるのか分子レベルの解明はまだ十分に行われていません。現在はスーパーコンピューターを使ってアルツハイマー病の疾患メカニズムを明らかにする試みがなされている最中です。
「②タンパク質の形や動きの調査による治療薬開発」に関しては、タンパク質の構造分析がポストゲノム時代の重要課題として認識されています。バイオインフォマティクスによって、タンパク質の配列、機能、構造の関係を明らかにすべく解析が進められており、過去の研究成果はデータベースに共有されています。例えば、文部科学省主導で取り組み、2002年から2006年度に解明されたタンパク質の構造を研究分野ごとに検索・閲覧できる「タンパク3000構造ギャラリー」があります。
「③コンピューターの中で生命のネットワークやシステムのシミュレーション」については、生体内の生命現象は個別の遺伝子が作用しあっている結果と理解されていますが、こうした遺伝子同士の相互作用のことを「パスウェイ」と呼びます。パスウェイには代謝経路やシグナル伝達系、タンパク質間の相互作用、遺伝子の制御関係などに関する情報も含まれます。インフォマティクスによって解析されたパスウェイはデータベースに保存されており、研究者・企業向けに公開中です。有名なものには、京都大学化学研究所・特任教授でバイオインフォマティクス研究者の金久實氏が1995年に開発した「Kyoto Encyclopedia of Genes and Genomes」があります。
医療分野で活用されるイメージが強いバイオインフォマティクスですが、現在ではAI技術が加わることでデータ解析に新たな可能性を広げています。それが生態系の研究分野である「④環境汚染物質を分解する生物や、有用な物質を作り出す生物の発見」です。例えば、AI技術を用いて、大規模な環境データや生物学的データを解析した場合、生物種の分布変化や絶滅リスクなどについて、より深い知見と洞察が得られるでしょう。このように地球環境問題の解決にも貢献することが期待されています。
生物学は幾多の研究を重ねることで多くの知見を蓄積してきました。しかし、生命現象の本質を理解するためにはさらなる情報収集と分析が必要になります。人間の力だけでは情報処理が追いつかない領域にまで到達しているのです。
上述したように1990年から始まったヒトゲノム計画はアメリカ、イギリス、日本、フランス、ドイツ、中国の6カ国の国際プロジェクトで3,000億円以上の費用と13年もの歳月がかかりました。この費用と期間を考えても、コンピューターによる解析を導入しなければ生物学の研究には膨大な費用と時間がかかることが分かります。
こうした生物学の発展に対してソリューションを提供できるのが、情報学であり、コンピューターであり、AIなのです。ここに生物学と情報学が融合する必然性を見て取ることができます。
例えば、バイオインフォマティクスに欠かせない画期的な基盤技術に「次世代シーケンシング」がありますが、この技術により扱えるデータが急激に増えたと言われています。従来の方法でDNAの塩基配列を決定する場合は1-96個のDNAを同時に扱うのが限界でしたが、次世代シーケンシングでは、1回で数千億もの塩基情報を得られるようになりました。
さらにバイオインフォマティクスの発展は次世代シーケンシングを実現するための最先端のツールを生み出しており、データを遺伝子の機能別、構造別にファイル形式で出力可能にしています。
広義においてバイオインフォマティクスの研究結果は人類の「大いなる財産」とも言えるでしょう。
現在のところ、生物のゲノム(遺伝子やDNA)はすべて解明されているわけではありませんが、研究が進むことで医学、理学、農学、薬学などの多くの分野に好影響を与えることが期待されます。さらに、近年注目されているのがバイオインフォマティクスと文化情報の融合です。
従来、生物学的データと組み合わされることがなかった人類学や歴史学、社会学などの分野と結び付けるアカデミック領域も発展しています。例えば、遺伝子データを用いて人類の移動パターンを解析した場合、文化交流の変遷を把握できる可能性があります。
バイオインフォマティクスの功績として最たる例は、DNAデータバンクによるデータの蓄積でしょう。今日の生命科学研究は、塩基配列のデータベースなしには考えられず、人間では不可能に近い膨大かつ広範囲のデータ処理を可能にしました。現在、データベースに各研究者が解析したゲノムの塩基配列を登録し、かつ閲覧できるなどの研究成果の共有も実現しています。
英国バイオバンクでは、これまでに英国全域の40~69歳の約50万人の人々から遺伝学的データ、健康データを収集し、保管しています。これらの研究結果はすべてオープンアクセスリソースとして利用可能です。日本でも、東北メディカル・メガバンク機構は計15万人を超える塩基配列を収集し、中国では2017年までに5400万人の遺伝情報を収集済みという報道もあります。
ただし、DNAデータバンクには課題もあります。遺伝子情報という高度な個人情報を企業や国家が管理してよいのか、世界各国において議論の的です。また、ゲノムデータが漏洩したり、悪用されたりするリスクもあるでしょう。こうした不安材料に対処するため、データ利用に関する法規制の整備などが不可欠です。
日本では2023年6月、ゲノム医療の推進と差別防止などを掲げる「ゲノム医療法」が施行されました。個人のゲノムや健康に関する情報を管理、活用するための基盤の整備を目指します。
日本のDNAデータバンク(DDBJ)は、国立遺伝学研究所という機関によって運営されています。
DDBJは、米国NCBI/GenBank、欧州EBI/EMBLという2つのDNAデータベースと連携することで国際的なネットワークを構築しています。DNAデータバンクに格納されている遺伝子情報にすぐにアクセスできるため、世界中の幅広い分野の研究者による研究結果の共有が可能です。この国際的DNAデータベースは「DDBJ/EMBL/GenBank 国際塩基配列データベース」と呼ばれます。
このようなデータベースの活用例として、医療現場における診断や治療への発展への寄与が挙げられます。医療現場の端末からも最新の研究結果にすぐにアクセスできるようになれば、人類が受けられる医療の形も大きく変わっていくでしょう。
バイオ領域の未来を担う学問として期待されているバイオインフォマティクスですが、未だ発展途上とも言えます。近年はバイオ領域へのAIなどのテクノロジー導入が進んでおり、バイオDXによるさらなる発展が見込まれています。
市場調査レポート「バイオインフォマティクスの世界市場 2023年~2030年」によると、バイオインフォマティクスの世界市場規模は2022年に114億米ドル(約1兆6618億円)に達し、2030年には291億米ドル(約4兆2417億円)に達する見込みです。また、同レポートは、バイオインフォマティクスの世界市場は2023年~2030年にかけて12.8%のCAGR(年平均成長率)を示すと予測しています。
バイオインフォマティクスの世界市場には、遺伝子工学、医薬品開発、個別化医療などが含まれており、創薬と市場開拓への注目度が高まっていることや、個別化医療の採用の増加、核酸やタンパク質のシーケンシング需要の高まりが今後も成長を支えていくことが考えられます。
加えて、AIや機械学習は世界のバイオインフォマティクスの世界市場拡大を促進する大きな要因です。これらの最先端技術により、研究者は大規模なゲノムなどの生物学的データを効率的に扱い、正確な予測を行えます。
一方、上述したように世界各国で遺伝子情報を扱うことについてデータセキュリティやプライバシーの問題が懸念されているため、今後厳格な規制が施行されるリスクもあり、今後の市場規模は予測と乖離する可能性も含んでいます。そのため、今後の動向に注目です。
従来の生命科学研究では、人間の認知能力や作業量による制約、さらに偶然の発見に期待する不確実性が高い一面もありました。近年は、バイオインフォマティクスをベースにした質の高いビッグデータの取得と解析、AI駆動による研究によって、人間の認知能力だけではたどり着けなかった科学的発見につながる可能性が高まっています。
従来の生命科学研究では避けられなかった研究者のバイアスを、バイオインフォマティクスの活用によって超えることが可能です。自然言語処理技術などにもとづく、既存の領域知識の抽出や活用に加え、能動推論により実験結果を解釈、仮説を立てることが容易になるでしょう。
バイオインフォマティクスは、生物学が蓄積した偉大な知見と研究成果を土台にして、圧倒的な情報量を担保し、より正確な予測を立てることで真理探究を行う学問です。バイオインフォマティクスが進むにつれて、人類はより多くの遺伝子情報や研究結果を共有可能となり、医学、農学、理学、さらには人文学に至るまでさまざまな領域と生物学を融合することが可能になるでしょう。
従来の研究室で実際に細胞や微生物を扱う「Wet研究」から、バイオインフォマティクスというITやAI技術を用いてコンピュータ上でシミュレーションする「Dry研究」へ、生物学はドラスティックな変化を遂げています。大学や大学院で生物学を専攻した方のみならず、ビッグデータやAIを扱えるDX人材をも取り込もうとしているバイオインフォマティクスから目が離せません。
クリーク・アンド・リバー社が運営する「Laboしごと」では、バイオ系研究職の派遣・社員求人を多数掲載しています。また、転職活動アドバイスや、スキルアップ支援コンテンツなどのサービスも用意されています。
無料かつ、簡単に登録完了できるため、ご興味のある方はぜひ「会員登録」して、引き続きLaboしごとをお楽しみください。