English

大学共同利用機関法人 自然科学研究機構

基礎生物学研究所

  • Home
  • 共同利用研究
  • > 開催リスト
  • > 2012秋「次世代DNAシークエンサーデータ解析入門」

共同利用研究

トレーニングコース - 開催リスト

2012秋「次世代DNAシークエンサーデータ解析入門」

Organizers 重信 秀治、内山 郁夫、三輪 朋樹、山口 勝司
(基礎生物学研究所・生物機能解析センター)
Venue 基礎生物学研究所
Date Sep. 6-7, 2012
Link ウェブサイト (http://www.nibb.ac.jp/training/2012-2nd/index.html)
 2012 年9月6日から2日間、ゲノムインフォマティクス・トレーニングコース2012 秋「次世代DNA シークエンサーデータ解析入門」を開催しました。生物情報学を必ずしも専門としない生物研究者が、次世代シークエンサーから得られるデータを解析し生物学的な情報を抽出するための、基礎的技術と考え方を身に付けることを目的としたコースです。今回で3回目になりますが、進歩の早い次世代シークエンシング業界の状況を反映させて、毎回内容を少しずつアップデートしています。以下のように、UNIX の基礎から次世代シークエンシングデータ解析の実際まで2日間でひととおり学習するかなりハードなプログラムでしたが、16 名の受講生の皆さんは最後まで集中力をきらさずに完走いたしました。
 日本国内でも次世代シークエンサーが少しずつ浸透してきました。われわれのトレーニングコースは、このように関心の高まっている次世代シークエンサーデータ解析を「自分で学びたい」という実験系研究者の良い受け皿になっていると感じています。
重信 秀治)
 

2012sep_1.jpg 2012sep_2.jpg 2012sep_3.jpg

 

Program

9月6日(木)
   9:30 - 受付開始(基礎生物学研究所 明大寺地区)
 10:00 - 11:00 NGSデ-タ解析概論
 11:00 - 12:00 UNIX入門(前編)
 (Lunch:食堂)
 13:00 - 14:30 UNIX入門(後編)
 14:45 - 16:00 NGS基本デ-タフォ-マット
 16:15 - 18:00 NGS基本ツ-ルI:mapping
 18:30 - 懇親会

9月7日(金)
  9:00 - 12:00 NGS基本ツ-ルII:IGV, III:samtools
 (Lunch:食堂)
 13:00 - 14:00 テキストデ-タ処理法
 14:15 - 17:00 実践演習

 講習・実習内容:

トランスクリプトームデータ解析概論:次世代DNAシークエンサーやマイクロアレイを用いたトランスクリプトーム研究を概観し、そのデータ解析手法の現状 と問題点を概説する。そして、これらのデータ解析のために、われわれ生物学者は何を学ばなければいけないか、を提案する。

統計学入門・R入門:トランスクリプトームデータを解析するためには、統計学的な考え方、それに基づいた実験デザイン法を身に付けることが必須である。また、種々の統計解析をサポートしたプログラミング言語Rの最小限の使い方を習得する。

RNA-seqの解析パイプライン:次世代シークエンサーから得られるシークエンスデータを発現データにまで変換するパイプラインを理解する。リファレンスゲノムへのマッピングと、遺伝子モデルに基づいたカウントの方法の実際を学ぶ。

マッピングデータの基本フォーマットと基本ツール:次世代シークエンシングデータのマッピングデータはSAM/BAMと呼ばれる業界標準フォーマットで保 存される。RNA-seqのマッピングデータを最大限に活用するために、SAM/BAMファイルの操作法や可視化法を学ぶ。samtoolsとIGVとい うソフトウェアを紹介する。

発現データ解析 I:発現変動のある遺伝子を同定することはトランスクリプトーム解析の主要な目的である。Normalizationとdifferential expression analysisの原理と解析法について学ぶ。

発現データ解析 II:トランスクリプトームのような大規模データから特徴を抽出し、人間が見て仮説を立てられるようにするための概念・方法を学ぶ。遺伝子発現解析における多変量解析は、データセット内の挙動の似ているものをまとめて大規模データをより低い次元のデータに縮約し、それを可視化し、実験者の理解を促す手法である。多変量解析の代表的なものの原理と解析法の実際について学ぶ。
 

実践演習:実データを使って実戦的な演習を行う。