![]() |
ノート/platanusまとめhttp://pepper.is.sci.toho-u.ac.jp/pepper/index.php?%A5%CE%A1%BC%A5%C8%2Fplatanus%A4%DE%A4%C8%A4%E1 |
![]() |
ノート/ノート
訪問者数 1835 最終更新 2017-03-31 (金) 16:15:12
トップページ
Platanus Assembler 書いてあることはほぼ同じ
Platanus is a novel de novo sequence assembler that can reconstruct genomic sequences of
highly heterozygous diploids from massively parallel shotgun sequencing data.
tips & usage
To get good statistical results, mate-pair library sequences are indispensable. We received many claims and questions of poor assembling results. However, in almost all cases, only paired-end sequences were inputted. Except in the case of assembling very simple and small size genomes, it is impossible to get good results without using a mate-pair library.
インストールは、ダウンロードページ http://platanus.bio.titech.ac.jp/platanus/?page_id=14 からソースでダウンロード、README.txtに従って、make して終わり。 バイナリを、見えるように/usr/local/bin/からシンボリックリンクを貼っておく。
PlatanusのTips & Usageのページにも簡単なPlatanus Tutorialがある。
Tutorialにあるように、DRP002483:https://trace.ddbj.nig.ac.jp/DRASearch/study?acc=DRP002483から、Experiment DRX019819 のFASTQを開いて、
を得る。同様に、Experiment DRX019820 のFASTQを開いて、
を得る。
ここではJSTバイオサイエンスデータベースセンターのH28年度 NGSハンズオン講習会カリキュラム(門田先生方)での 第2回目「第1部統計解析」の「ゲノム解析・塩基配列解析」の スライド27〜31にある手順で試してみる。 ただし、DDBJパイプラインサービスを使わず、自前でダウンロードして行う。
DDBJのDRA Searchから DDR024501 を探してダウンロード。
wget ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA002/DRA002643/DRX022186/DRR024501_1.fastq.bz2 bunzip2 DRR024501_1.fastq.bz2 wget ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA002/DRA002643/DRX022186/DRR024501_2.fastq.bz2 bunzip2 DRR024501_2.fastq.bz2
Step 1) Assembly
platanus assemble -t 15 -m 120 -o out -f DRR024501_1.fastq DRR024501_2.fastq
Step 2) Scaffold
platanus scaffold -o out -c out_contig.fa -b out_contigBubble.fa -IP1 ./DRR024501_1.fastq ./DRR024501_2.fastq -t 8
Step 3) Gap_Close
platanus gap_close -o out -c out_scaffold.fa -IP1 ./DRR024501_1.fastq ./DRR024501_2.fastq -t 8