ノート/ノート
159   2017-02-12 (日) 17:03:19

ノート/DRY解析教本_2017-02-12

DRY解析教本の練習のコメント

Level2 発言解析(97ページ)

ginger環境で実験

解析準備

データの入手

レファレンスデータのダウンロード

wget -r http://shujunsha.com/NGS_DAT/Lv2_2/iGenome/Homo_sapiens/

はうまくいかなかった。問題はrobot.txtがあるためらしく、/etc/wgetrc上で robots=off を指定 するとOKとなった。

105ページからの記述は、別のデータを必要としている。

wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR266/ERR266335/ERR266335.fastq.gz
wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR266/ERR266349/ERR266349.fastq.gz
wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR266/ERR266337/ERR266337.fastq.gz
wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR266/ERR266351/ERR266351.fastq.gz
wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR266/ERR266338/ERR266338.fastq.gz
wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR266/ERR266347/ERR266347.fastq.gz

106ページにある、SRAtoolkitのダウンロード。これはSRAファイルをダウンロードした場合のfastqファイルを取り出すツール。
本ではHomebrewでインストールしている
NCBI SRA Toolkit
NCBI SRA Toolkitの使い方
[[Linux用パッケージをダウンロード:

wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.8.1-3/sratoolkit.2.8.1-3-centos_linux64.tar.gzw

展開した後、ディレクトリノードを/usr/local/sratoolkitにmvしておいて、~/.bash_profile中に

PATH=/usr/local/sratoolkit:$PATH
export PATH

FastQCによるチェック

まず、出力を置くためのディレクトリを作っておく。./FastQCとする。解析は、

fastqc --nogroup -o ./FastQC ERR266335.fastq

faxtx_toolkitによるトリミング

まず、fastx_toolkitをインストール。
Linux用パッケージをダウンロード
展開するとbinディレクトリができるので、、そのbinノードを /usr/local/fastx_toolkit/bin にmvしておいて、~/.bash_profile中に

PATH=/usr/local/fastx_toolkit:$PATH
export PATH

トリミングは

fastq_quality_trimmer -Q 33 -t 20 -l 30 -i ERR266335.fastq -o ERR266335_trim.fastq

TopHatでマッピングする

tophat -p 32 -G Homo_sapiens/NCBI/build37.2/Annotation/Archives/archive-2014-06-02-13-47-29/Genes/genes.gtf -o tophat_results/ERR266335_P0 ./ERR266335_trim.fastq

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2017-02-12 (日) 17:03:19 (160d)