バイオと化学には密接な関係性があり、バイオ研究者が扱う生命現象や実験については化学の知識も関係します。 そのため、大学や大学院でバイオ領域を学び、研究に従事した人が、卒業後に化学メーカーに就職するというケースも少なくありません。
現在、バイオ領域の研究職に就きたいと考えている学生や、バイオ業界に就職した人も、化学の知見を身につけることは、研究や開発において人材価値の向上につながると考えられます。
では、「バイオ研究者が学ぶべき化学」とは何でしょうか?化学の分野は多岐にわたりますが、その一つが化学とインフォマテクス(情報学)を結び付けた「ケモインフォマティクス」です。
生物学(バイオロジー/Biology)と化学(ケミストリー/Chemistry)は、研究領域や就職において、何かと関連性が見られる学問です。
化学は物質の構造や性質、物質間の変化や反応を実験によって追求していく学問ですが、生物学の研究対象である生命現象を解き明かすためにも欠かせません。
一方、大学や大学院で生物学を研究した人が化学関連の企業に就職するケースは珍しくなく、特に創薬関連の企業にはバイオ分野で活躍してきた人材も多くいます。
研究においてバイオと化学のシナジーが生まれることもあり、両者を融合させた学問領域も生まれています。 その具体例が、「ケミカルバイオロジー」と「バイオケミストリー」です。
「ケミカルバイオロジー」とは、分子生物学的な手法と有機化学的な手法を駆使し、核酸やタンパク質などの機能を分子レベルで解明しようとする学問領域です。化学的観点や化学的手法を用いて生命現象を解明する分野とも言い換えられます。ケミカルバイオロジー研究は、1990年代後半より米国を中心に行われてきました。
ケミカルバイオロジーは小分子から生体高分子まで幅広く研究することで、生体機能の制御・解析や酵素反応など、生体内反応のモデル化を目指します。主な研究対象は「薬」に関連する化合物が多く、特異な生理活性を有するものです。
こうした分子の「ふるまい」や分子構造を化学反応式で表せるようになったのは、ケミカルバイオロジー的なアプローチによるところが大きいとされています。そして、その背景には電子顕微鏡、X線構造解析、核磁気共鳴吸収法などにより、タンパク質や遺伝情報を担う核酸の分子構造を解析するための技術・手法が進歩したことが挙げられます。
ケミカルバイオロジーが創薬分野に活用された事例としては、免疫抑制剤FK506の作用機序の解明があります。
「バイオケミストリー」とは、生体の中に存在するタンパク質、核酸、糖、代謝化合物などを見つけ出し、その構造や機能を解明する学問領域を指します。いわば「生体現象内の化学」が研究対象です。
ケミカルバイオロジーよりも学問としての歴史は古く、1世紀以上前の1903年にはすでに「バイオケミストリー」という言葉が提唱されていたようです。
具体的にバイオケミストリーで研究するメカニズムには、脳の機能や細胞間および細胞内のコミュニケーションなどがあります。
バイオケミストリーの研究では化学や分子生物学に加え、物理学、免疫学などの手法も組み合わせる必要があるため、幅広い知見とスキルが身につきます。
「ケモインフォマティクス(chemoinfomatics)」とは、「化学(chemistry)」と「情報学(informatics)」を組み合わせた言葉で、1998年に計算科学者 として知られるF.K.ブラウンによって提唱されました。
バイオ領域でも「バイオインフォマティクス」という生物学と情報学を融合させた学問があり、ドライ系職種として注目されていますが、背景にはコンピューターや情報化技術の目覚ましい進化があります。
ここでは、バイオ研究者も理解しておきたいケモインフォマティクスについて解説します。
ケモインフォマティクスは、日本語では「情報化学」とも呼ばれています。コンピューターによる情報科学の手法を広く化学に取り入れた分野で、計算科学にもとづくデータベースを用いた化合物の構造と活性の相関研究などで知られます。
その目指すところは、データの解析や体系化によってより速く、より良い判断をすることです。具体的には、できるだけ少ない実験数で網羅的に条件検討することを目指す実験計画法の構築、医薬品・材料などの分子検索、物質の機能と活性との関係を構造から研究する構造活性相関研究などに利用されています。
「化学」と「情報学」の融合であるため、有機化学、物理化学、分析化学、生化学などの基本概念を学ぶことに加え、情報科学、データ解析、さらには生物学の知識が必要です。インフォマティクスでは多くのソフトウェアやツールが使用されるため、それらに精通し、実際のプロジェクトで使えるようにしておく必要もあります。
ケモインフォマティクスは手法としては新しいですが、目指しているものは化学という学問領域の究極の目的と関連しています。
米国の化学者G・S・ハモンドは1968年に「合成の最も基本的で永続的な目的は、新しい化合物の生産ではなく特性の生産」であると述べており、目的とする特性と化学構造を関連付けられれば、化学物質が人の健康や社会に与える影響を先験的に知ることが可能です。
ケモインフォマティクスによって目的とする特性と化学構造を関連付け、重要な構造を見つける作業は、従来とは比べものにならないほど効率的かつ正確に行えるようになってきています。
例えば、創薬の開発成功率は3万分の1、9~17年もの歳月を要するとも言われており、ほとんどの候補物質は途中の段階で新薬開発を断念せざるを得ないのが現状です。
しかし、ケモインフォマティクスが今後より普及・発展していけば、創薬成功の確率は高まり、開発までにかかる期間も短縮できると考えられます。
ケモインフォマティクスで使用される代表的なツールとしてRDKitやpymatgenが挙げられますが、これらは基本的にPython(パイソン)というプログラミング言語で提供されています。そのため、これからケモインフォマティクスに取り組みたいというバイオ研究者はPythonから学ぶのがおすすめです。
プログラミング言語にはR、Java、C++、SQL、JavaScript、Perlなどがあり、それぞれに特徴があります。その中でもPythonはアプリの開発・データ分析において人気や汎用性が高く、科学技術分野を中心に広く使われている言語です。
Pythonは人が書いたプログラムを機械語に翻訳して実行する「インタプリタ言語」です。そのため、人が書いた言語を機械が認識できる形式に変換する「コンパイル」という作業が不要で、実行速度は遅くなるものの、エラーなどを即座に発見できるメリットがあります。また、学習者が多いため、分からないことにぶつかったときもWeb上で情報を検索したり、解決手段を尋ねたりできるのも特徴の一つといえるでしょう。
コードが短くシンプルで使いやすいですが、難解な計算処理にも対応しており、学習することで多方面での応用も期待できるはずです。