基礎生物学研究所
Organizers | 重信 秀治、内山 郁夫、三輪 朋樹、山口 勝司 (基礎生物学研究所・生物機能解析センター) |
|
---|---|---|
Venue | 基礎生物学研究所 | |
Date | Sep. 6-7, 2012 | |
Link | ウェブサイト (http://www.nibb.ac.jp/training/2012-2nd/index.html) | |
9月6日(木)
9:30 - 受付開始(基礎生物学研究所 明大寺地区)
10:00 - 11:00 NGSデ-タ解析概論
11:00 - 12:00 UNIX入門(前編)
(Lunch:食堂)
13:00 - 14:30 UNIX入門(後編)
14:45 - 16:00 NGS基本デ-タフォ-マット
16:15 - 18:00 NGS基本ツ-ルI:mapping
18:30 - 懇親会
9月7日(金)
9:00 - 12:00 NGS基本ツ-ルII:IGV, III:samtools
(Lunch:食堂)
13:00 - 14:00 テキストデ-タ処理法
14:15 - 17:00 実践演習
講習・実習内容:
トランスクリプトームデータ解析概論:次世代DNAシークエンサーやマイクロアレイを用いたトランスクリプトーム研究を概観し、そのデータ解析手法の現状 と問題点を概説する。そして、これらのデータ解析のために、われわれ生物学者は何を学ばなければいけないか、を提案する。
統計学入門・R入門:トランスクリプトームデータを解析するためには、統計学的な考え方、それに基づいた実験デザイン法を身に付けることが必須である。また、種々の統計解析をサポートしたプログラミング言語Rの最小限の使い方を習得する。
RNA-seqの解析パイプライン:次世代シークエンサーから得られるシークエンスデータを発現データにまで変換するパイプラインを理解する。リファレンスゲノムへのマッピングと、遺伝子モデルに基づいたカウントの方法の実際を学ぶ。
マッピングデータの基本フォーマットと基本ツール:次世代シークエンシングデータのマッピングデータはSAM/BAMと呼ばれる業界標準フォーマットで保 存される。RNA-seqのマッピングデータを最大限に活用するために、SAM/BAMファイルの操作法や可視化法を学ぶ。samtoolsとIGVとい うソフトウェアを紹介する。
発現データ解析 I:発現変動のある遺伝子を同定することはトランスクリプトーム解析の主要な目的である。Normalizationとdifferential expression analysisの原理と解析法について学ぶ。
発現データ解析 II:トランスクリプトームのような大規模データから特徴を抽出し、人間が見て仮説を立てられるようにするための概念・方法を学ぶ。遺伝子発現解析における多変量解析は、データセット内の挙動の似ているものをまとめて大規模データをより低い次元のデータに縮約し、それを可視化し、実験者の理解を促す手法である。多変量解析の代表的なものの原理と解析法の実際について学ぶ。
実践演習:実データを使って実戦的な演習を行う。