[[ノート/ノート]]~
&counter();   &lastmod();~

* ノート/DRY解析教本_2017-02-12 [#rceed21e]
DRY解析教本の練習のコメント

*Level2 発言解析(97ページ) [#ne6bebdc]
ginger環境で実験

***解析準備 [#y95fd7dd]
-サーバーへのRのインストール
 yum install R

-サーバーへのRStudioのインストール
--[[RStudioのダウンロードページ:https://www.rstudio.com/products/rstudio/download-server/]]
 $ wget https://download2.rstudio.org/rstudio-server-rhel-1.0.136-x86_64.rpm
 $ sudo yum install --nogpgcheck rstudio-server-rhel-1.0.136-x86_64.rpm
--[[RStudio Server: 始めよう:http://memorandum2015.sakura.ne.jp/docs/server/getting_started.html]]
--TerTermでポートフォワード(ginger:8787をlocalへ)設定
--ブラウザで localhost:8787 をアクセス
--[[サーバーの起動・停止は:http://memorandum2015.sakura.ne.jp/docs/server/management.html]]
 sudo rstudio-server {start, stop, restart}

-フォルダを準備
bio/expression

-ツールソフト
[[国立遺伝学研究所〜利用可能バイオツール:https://sc.ddbj.nig.ac.jp/index.php/ja-biotools]]
--[[bowtie2:http://bowtie-bio.sourceforge.net/bowtie2/index.shtml]]
TopHatのインストールに必要~
[[2.3.0のダウンロードページ:https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.3.0/]]~
linux binary(bowtie2-2.3.0-linux-x86_64.zip)をダウンロードして適当なディレクトリにセットするか、ソース(bowtie2-2.3.0-source.zip)をmakeするか、だが、linux binaryの場合(おきっぱなし型なので)内部のディレクトリ指定が不明なので、ソースからmake, make installしよう。~


--[[TopHat:http://ccb.jhu.edu/software/tophat/index.shtml]]~
[[2.1.1のLinuxバイナリ:http://ccb.jhu.edu/software/tophat/downloads/tophat-2.1.1.Linux_x86_64.tar.gz]] か [[2.1.1のソース:http://ccb.jhu.edu/software/tophat/downloads/tophat-2.1.1.tar.gz]]~
Linuxバイナリをダウンロード、展開。/usr/local/binからリンクを貼っておく。~
 cd ~/src 
 wget http://ccb.jhu.edu/software/tophat/downloads/tophat-2.1.1.Linux_x86_64.tar.gz
 tar xvf tophat-2.1.1.Linux_x86_64.tar.gz
 sudo ln -s ~/src/tophat-2.1.1.Linux_x86_64/tophat2 /usr/local/bin/tophat2

--[[cufflinks:http://cufflinks.cbcb.umd.edu/]]
[[Cufflinksページ:http://cole-trapnell-lab.github.io/cufflinks/]]~
[[2.2.1のLinuxバイナリ:http://cole-trapnell-lab.github.io/cufflinks/assets/downloads/cufflinks-2.2.1.Linux_x86_64.tar.gz]] か [[2.2.1のソース:http://cole-trapnell-lab.github.io/cufflinks/assets/downloads/cufflinks-2.2.1.tar.gz]]
Linuxバイナリをダウンロード、展開。/usr/local/binからリンクを貼っておく。~
 cd ~/src 
 wget http://cole-trapnell-lab.github.io/cufflinks/assets/downloads/cufflinks-2.2.1.Linux_x86_64.tar.gz
 tar xvf cufflinks-2.2.1.Linux_x86_64.tar.gz
 sudo ln -s ~/src/cufflinks-2.1.1.Linux_x86_64/cufflinks /usr/local/bin/cufflinks

--cummeRbund  [[CummeRbundで遺伝子発現のプロットを遺伝子ごとに並べる:http://qiita.com/yuifu/items/cc9730f7e3a1277f6c50]]~
R(RStudio)を起動し、その中でインストールする。~
 source("http://bioconductor.org/biocLite.R")
 biocLite("cummeRbund")

--[[FastQC:http://bi.biopapyrus.net/rnaseq/qc/fastqc.html]]~
クオリティチェックの代表的なプログラムとして FastQC がある。FastQC は Java で書かれているため、OS を問わずにダウンロードすればすぐに利用できる。Linux 上では GUI 画面が利用できるに加え、コマンドラインからも利用でき、非常に便利なプログラムである。~
[[ダウンロード(babraham univ):http://www.bioinformatics.babraham.ac.uk/projects/download.html#fastqc]]~
[[v0.11.5のLinuxパッケージ:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.5.zip]]をダウンロードしunzip。 あとは、
 sudo ln -s ~/src/FastQC/fastqc /usr/local/bin/fastqc


***データの入手 [#c7b5cf02]
レファレンスデータのダウンロード~
 wget -r http://shujunsha.com/NGS_DAT/Lv2_2/iGenome/Homo_sapiens/
はうまくいかなかった。問題はrobot.txtがあるためらしく、[[/etc/wgetrc上で robots=off を指定:http://chibitcpu.blogspot.jp/2014/09/wget-robotstxt.html]] するとOKとなった。

105ページからの記述は、別のデータを必要としている。
 wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR266/ERR266335/ERR266335.fastq.gz
 wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR266/ERR266349/ERR266349.fastq.gz
 wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR266/ERR266337/ERR266337.fastq.gz
 wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR266/ERR266351/ERR266351.fastq.gz
 wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR266/ERR266338/ERR266338.fastq.gz
 wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR266/ERR266347/ERR266347.fastq.gz

106ページにある、SRAtoolkitのダウンロード。これはSRAファイルをダウンロードした場合のfastqファイルを取り出すツール。~
本ではHomebrewでインストールしている~
[[NCBI SRA Toolkit:https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software]]~
[[NCBI SRA Toolkitの使い方:http://blog.amelieff.jp/?eid=185662]]~
[[Linux用パッケージをダウンロード:
 wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.8.1-3/sratoolkit.2.8.1-3-centos_linux64.tar.gzw
展開した後、ディレクトリノードを/usr/local/sratoolkitにmvしておいて、~/.bash_profile中に
 PATH=/usr/local/sratoolkit:$PATH
 export PATH

***FastQCによるチェック [#z221cab8]
まず、出力を置くためのディレクトリを作っておく。./FastQCとする。解析は、
 fastqc --nogroup -o ./FastQC ERR266335.fastq

***faxtx_toolkitによるトリミング [#pe216838]
まず、[[fastx_toolkit:http://hannonlab.cshl.edu/fastx_toolkit/]]をインストール。~
[[Linux用パッケージをダウンロード:http://hannonlab.cshl.edu/fastx_toolkit/download.html]]。~
展開するとbinディレクトリができるので、、そのbinノードを /usr/local/fastx_toolkit/bin にmvしておいて、~/.bash_profile中に
 PATH=/usr/local/fastx_toolkit:$PATH
 export PATH

トリミングは
 fastq_quality_trimmer -Q 33 -t 20 -l 30 -i ERR266335.fastq -o ERR266335_trim.fastq

***TopHatでマッピングする [#b8c8a6f0]
 tophat -p 32 -G Homo_sapiens/NCBI/build37.2/Annotation/Archives/archive-2014-06-02-13-47-29/Genes/genes.gft -o tophat_results/ERR266335_P0 ./ERR266335_trim.fastq
 tophat -p 32 -G Homo_sapiens/NCBI/build37.2/Annotation/Archives/archive-2014-06-02-13-47-29/Genes/genes.gtf -o tophat_results/ERR266335_P0 ./ERR266335_trim.fastq

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS