共同利用研究

トレーニングコース - 開催リスト

2012秋「次世代ＤＮＡシークエンサーデータ解析入門」

	重信秀治、内山郁夫、三輪朋樹、山口勝司（基礎生物学研究所・生物機能解析センター）
Organizers	重信秀治、内山郁夫、三輪朋樹、山口勝司（基礎生物学研究所・生物機能解析センター）
Venue	基礎生物学研究所
Date	Sep. 6-7, 2012
Link	ウェブサイト　（http://www.nibb.ac.jp/training/2012-2nd/index.html）
	ウェブサイト　（http://www.nibb.ac.jp/training/2012-2nd/index.html）

　2012 年９月６日から２日間、ゲノムインフォマティクス・トレーニングコース2012 秋「次世代DNA シークエンサーデータ解析入門」を開催しました。生物情報学を必ずしも専門としない生物研究者が、次世代シークエンサーから得られるデータを解析し生物学的な情報を抽出するための、基礎的技術と考え方を身に付けることを目的としたコースです。今回で３回目になりますが、進歩の早い次世代シークエンシング業界の状況を反映させて、毎回内容を少しずつアップデートしています。以下のように、UNIX の基礎から次世代シークエンシングデータ解析の実際まで２日間でひととおり学習するかなりハードなプログラムでしたが、16 名の受講生の皆さんは最後まで集中力をきらさずに完走いたしました。

　日本国内でも次世代シークエンサーが少しずつ浸透してきました。われわれのトレーニングコースは、このように関心の高まっている次世代シークエンサーデータ解析を「自分で学びたい」という実験系研究者の良い受け皿になっていると感じています。

（重信秀治）

Program

９月６日（木）
　 9:30 - 受付開始(基礎生物学研究所明大寺地区)
　10:00 - 11:00　NGSデ-タ解析概論
　11:00 - 12:00 UNIX入門(前編)
　(Lunch:食堂)
　13:00 - 14:30 UNIX入門(後編)
　14:45 - 16:00 NGS基本デ-タフォ-マット
　16:15 - 18:00 NGS基本ツ-ルI:mapping
　18:30 - 懇親会

９月７日（金)
　 9:00 - 12:00　NGS基本ツ-ルII:IGV,　III:samtools
　(Lunch:食堂)
　13:00 - 14:00　テキストデ-タ処理法
　14:15 - 17:00　実践演習

講習・実習内容：

トランスクリプトームデータ解析概論：次世代DNAシークエンサーやマイクロアレイを用いたトランスクリプトーム研究を概観し、そのデータ解析手法の現状と問題点を概説する。そして、これらのデータ解析のために、われわれ生物学者は何を学ばなければいけないか、を提案する。

統計学入門・R入門：トランスクリプトームデータを解析するためには、統計学的な考え方、それに基づいた実験デザイン法を身に付けることが必須である。また、種々の統計解析をサポートしたプログラミング言語Rの最小限の使い方を習得する。

RNA-seqの解析パイプライン：次世代シークエンサーから得られるシークエンスデータを発現データにまで変換するパイプラインを理解する。リファレンスゲノムへのマッピングと、遺伝子モデルに基づいたカウントの方法の実際を学ぶ。

マッピングデータの基本フォーマットと基本ツール：次世代シークエンシングデータのマッピングデータはSAM/BAMと呼ばれる業界標準フォーマットで保存される。RNA-seqのマッピングデータを最大限に活用するために、SAM/BAMファイルの操作法や可視化法を学ぶ。samtoolsとIGVというソフトウェアを紹介する。

発現データ解析 I：発現変動のある遺伝子を同定することはトランスクリプトーム解析の主要な目的である。Normalizationとdifferential expression analysisの原理と解析法について学ぶ。

発現データ解析 II：トランスクリプトームのような大規模データから特徴を抽出し、人間が見て仮説を立てられるようにするための概念・方法を学ぶ。遺伝子発現解析における多変量解析は、データセット内の挙動の似ているものをまとめて大規模データをより低い次元のデータに縮約し、それを可視化し、実験者の理解を促す手法である。多変量解析の代表的なものの原理と解析法の実際について学ぶ。

実践演習：実データを使って実戦的な演習を行う。