データサイエンスプログラム ビッグデータを創造の力にする

datascience-2000.jpg

ビッグデータを創造の力に

ITインフラの整備、機械学習やAI技術の進展に伴い、データを扱える人材が求められています。このプログラムでは、「応用基礎」レベルの知識・技術を習得するとともに、生命科学に特化したゲノムメタゲノム情報の利用や医療ビッグデータを活用できる人材の養成を目指します。

プログラムが目指す学修成果

  • 情報収集・分析力
  • 数理能力・IT力
  • 論理的思考力
  • 課題発見・解決力

プログラム内容

outline-datascience.jpg

生命科学研究においても、またサイエンス・ビジネスにおいても、データサイエンスは不可欠の要素となっています。クラウド環境などITインフラの整備により膨大なデータリソースが形成されつつあり、また機械学習やAI(人工知能)技術の進展ともあいまって、各業界でビッグデータを管理・加工・解析できる人材の確保が急務となっています。政府が発表した「AI戦略2019」でも、文系・理系を問わず数理・データサイエンス教育の充実が掲げられ、レベルに応じて 3 段階のモデルカリキュラムが策定されています。本学部のプログラムでは、このうちの第 2 段階「応用基礎」レベルの知識・技術を習得するとともに、生命科学に特化したゲノム・メタゲノム情報の利用や医療ビッグデータの活用のできる人材の養成を目指します。

対象科目をピックアップ

数学Ⅱ

前期に学んだ数学Ⅰの内容を前提として、AI時代のデータサイエンスに必要な数理的基礎を学びます。前半は微分積分、後半は線形代数に関して、より高度な内容を取り扱う。冪級数や線型空間など抽象的な概念を学ぶとともに、証明とその背景にある論理的思考を重視します。本科目の授業内容は、政府の「AI 戦略2019」における数理・データサイエンス教育のモデルカリキュラムのうち、第2 段階の「応用基礎レベル」のスキルセットに相当します。

コンピテンシー
情報収集/課題解決/批判的思考/論理的思考/ディスカッション
生物統計学

生命科学の実習やデータ発表を行うときに、統計学的な解析が必要となることが多くあります。統計解析ソフトウェアも手軽に利用できるようになっています。しかし、間違った解析手法を行う例も多くあります。本講義では、生命科学に必要な基礎的な統計用語と手法を理解することを目標とします。

生命科学Ⅳ(基礎情報学)

いま世の中は3 回目の人工知能ブームに沸いています。近い将来、人工知能が人間を凌駕し、これまでとは根本的に異なる世界が出現するという話もあります。これは機械の人間化・生物化と言えますが、一方で、臓器移植や人工授精の一般化、ゲノム編集やブレイン・マシン・インターフェースの登場などにみられるように、人間や生物の機械化も同時に進みつつあると言えます。しかし、そうした理論や技術のほとんどは、情報、人間、生命などに関する、非常に強力だけれども、ひどく単純な見方に依拠しています。こうした現代的、将来的問題を読み解くには、情報現象と生命現象に共通する領域の根本的な探求が不可欠です。そもそも、情報とは何でしょうか。意味はコンピュータで適切に扱えるでしょうか。人間や生物は機械と同じでしょうか、もし異なるとすれば、それはどのように異なるのでしょうか。こうした問いは、生物学や計算機科学はもちろんのこと、システム論や記号論・記号学といった領域から、社会や倫理、自己や他者といったテーマにまで続いています。実に広い探求が必要ですが、幸いにしてすでに多くの人々がいろいろな方向から接近し、さまざまな見解を提示してきています。この授業では、それらを横断的に眺めながら、情報現象と生命現象の根本をみなさんと一緒に探っていきたいと思います。

生命医科学Ⅸ(ゲノム医科学)

ゲノム研究は生命科学の基盤となる研究分野であるだけでなく、医学・医療に革新的な変革をもたらすことは確実です。生命の謎が解き明かされることは、多くの疾患の根本的な原因の解明に直結しており、これを通して、分子標的薬や抗体薬・ワクチン療法などさまざまな画期的な治療の開発につながることが期待されます。更に個人のゲノム情報の解析によりオーダーメイド的な治療を提供していくことも可能となります。そこでこれらの基盤となるゲノムの構成、遺伝子発現の制御機構を理解するとともに、染色体異常や疾患遺伝子の染色体マッピング、薬理ゲノム学などゲノム医科学の基礎知識を習得します。

応用生命科学IX(ゲノム進化学)

現在地球上で見られる多様な生物は、地球誕生の後、生命が生まれてからの30 億年以上の長い進化の歴史の産物です。それは人類も例外ではありません。また、進化は、分子(DNA、タンパク質等)や細胞から個体、集団の様々なレベルで、それぞれの生物を形作ってきました。進化の基本はダーウィンによってまとめられた自然選択によって説明されるが、その基盤として分子レベルの進化も重要です。分子レベルでの進化(分子進化)は、様々な生物学の問題を理解するために重要になってきています。本講義の受講者は、主として分子進化学の観点から現在の進化おける考え方を知り、基礎的な進化研究法を修得します。合わせて、地球上での生命の進化の歴史の産物としてのヒトという生物の立ち位置について考察します。

学生インタビュー

データサイエンスを自身の強みに。生命科学をもっと深く。

私は将来、製薬企業でデータの解析を行う仕事に就きたいと考えています。そのために私は現在プログラミングや統計学を学んでいます。プログラミングはデータを処理するツールとして、統計学はデータを読み解くための知識として必要であると私は捉えています。そしてツールや知識を手に入れることにより、数字から意味のある情報を見出すことが可能になると考えています。その考えは学生実習や卒業研究の場において、実験データの解析を行うことの必要性を実際に体感したことから来ています。またプログラミングや統計学について学ぶことで論理的に物事を考える良いトレーニングとなり、生命科学に関する学びや研究へも良い影響を及ぼしています。日々勉強をする中で、理解に時間や労力を要することも多々ありますが、自分の強みを作るために努力しています。

data-sato-900.jpg分子生命科学科 4年 佐藤 秀

教員インタビュー

AIを学んで新しい生命科学を探求しよう

生命科学部では、創立当初より情報科学やプログラミングに力を入れた教育を行ってきました。このデータサイエンスプログラムではそれを発展させ、より高度なデータ解析能力を育成します。
私は本学に赴任する前には、マテリアルズインフォマティクスに携わり、AI(機械学習)と量子化学計算を組み合わせてエネルギー効率の高い有機太陽電池の分子構造探索に取り組んでいました。現在は、その経験を活かして薬剤の新規構造探索を試みています。生命科学とAIなどの異なる分野を組み合わせて新しい研究に挑戦してみませんか?

data-noguchi-900.jpg野口 瑶 助教

インフォメーション

機械学習勉強会を開催

生命物理科学研究室において、統計数理研究所で行われているセミナーにZoomから参加しました。機械学習における過学習について勉強しました。
入力変数Xと目的関数Yのデータから、XとYの関数を計算します。この際、与えられたデータに適合し過ぎてしまうと、与えられたデータ以外の予測精度が極端に落ちる場合があります。これを過学習と呼びます。学生が難しいと感じた部分については、教員が都度フォローをしました。

datascience-info-1.png

PAGE TOP