近年、生命科学においてデータサイエンスの重要性が増しています。すなわち、顕微鏡画像、トランスクリプトームといった多様な情報が取得可能になったことで、これらのデータを扱う技術、および、そこから生物学的に意味のある情報を抽出する技術が必要不可欠になりつつあります。さらに、深層学習AIの技術の急速な発展も相まって、上記の情報に対してAIを用いて研究するという論文が多数発表されるようになりました。一方で、生命科学系研究者の多くが、多量のデータを扱う技術や知識に疎いこともあり、必ずしも実験で得られたデータがデータサイエンスの土俵に効果的に乗っていないという現状があります。本トレーニングコースにおいては、生命科学系研究者が上記に関する基礎的な知識と技術を習得することを目指します。
受講者数
20名
開催報告
本コースは、基礎生物学研究所 超階層生物学センター AI解析室、ならびに、新学術領域研究「学術研究支援基盤形成」先端バイオイメージング支援プラットフォーム(ABiS)の共催により実施しました。
Pythonプログラミングの基礎から始まり、基本的なデータの取り扱い方法、そして深層学習を用いた画像解析に至るまでの内容となっています。Pythonは近年、深層学習AIのみならず、主成分分析やUMAPなどの様々なデータ解析においてもファーストチョイスとなりつつあります。受講者の中にはプログラミング経験が全くない方も多く含まれていたため、プログラミングの基礎に十分な時間を割きました。その後、データの入出力や前処理法、データの可視化について学びました。深層学習のセクションでは、畳み込みニューラルネットワークを用いた画像分類の実装を行いました。生物系研究者にとってイメージしやすいように、トランスクリプトームデータを模したデータ形式や、細胞の顕微鏡画像を用いることで、抽象的になりがちなプログラミング講義・実習を具体的かつ実践的なものにしました。
受講者のアンケートから、「プログラミングにおいて何をしっかり身につければよいのか、逆に調べれば済むことは何なのか、そういった感覚がわかった」、「具体例があったのでイメージしやすかった」、「深層学習は難易度が高めだが、むしろそれがよかった」、といった感想が寄せられました。深層学習の世界は日進月歩ですが、ツールの使い方講座ではなく、原理・考え方に重点をおく普遍性の高い内容を目指したいと思います。
代表 小山宏史(初期発生研究部門)
Program
1日目:2024年9月18日(水)
12:30 – 13:00 受付
13:00 – 13:20 はじめに
13:20 – 14:10 pythonの導入
14:10 – 14:30 休憩
14:30 – 15:50 プログラミングの基礎
15:50 – 16:00 休憩
16:00 – 16:50 データの入出力
16:50 – 17:10 休憩
17:10 – 19:00 基礎的なデータ解析と演習
懇親会(参加希望者)
2日目:2024年9月19日(木)
09:00 – 09:30 ファイル名の操作
09:30 – 09:40 休憩
09:40 – 10:40 ユーザ定義関数・class
10:40 – 10:50 休憩
10:50 – 12:20 深層学習の基礎
12:20 – 13:10 昼休憩
13:20 – 14:00 基盤AI講義、画像処理の基本の講義
14:00 – 14:10 休憩
14:10 – 17:00 深層学習AIによる画像解析