[[ノート/ノート]]~
訪問者数 &counter();      最終更新 &lastmod();

*Platanusまとめ 2017-03-31 [#n0df02d2]
**Platanusイントロ [#u8e972a2]
[[トップページ:http://platanus.bio.titech.ac.jp/?p=1]]~
[[Platanus Assembler:http://platanus.bio.titech.ac.jp/?page_id=180]] 書いてあることはほぼ同じ~
Platanus is a novel de novo sequence assembler that can reconstruct genomic sequences of
highly heterozygous diploids from massively parallel shotgun sequencing data.

[[tips & usage:http://platanus.bio.titech.ac.jp/?page_id=2]]~
To get good statistical results, mate-pair library sequences are indispensable. We received many claims and questions of poor assembling results. However, in almost all cases, only paired-end sequences were inputted. Except in the case of assembling very simple and small size genomes, it is impossible to get good results without using a mate-pair library.

インストールは、ダウンロードページ http://platanus.bio.titech.ac.jp/platanus/?page_id=14 からソースでダウンロード、README.txtに従って、make して終わり。 バイナリを、見えるように/usr/local/bin/からシンボリックリンクを貼っておく。

**トライアル [#u7d1ea16]
[[PlatanusのTips & Usageのページ:http://platanus.bio.titech.ac.jp/?page_id=2]]にも簡単なPlatanus Tutorialがある。

Tutorialにあるように、[[DRP002483:https://trace.ddbj.nig.ac.jp/DRASearch/study?acc=DRP002483:https://trace.ddbj.nig.ac.jp/DRASearch/study?acc=DRP002483]]から、Experiment DRX019819 のFASTQを開いて、
-[[DRR021673_1.fastq.bz2:ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA002/DRA002407/DRX019819/DRR021673_1.fastq.bz2]], 
-[[DRR021673_2.fastq.bz2:ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA002/DRA002407/DRX019819/DRR021673_2.fastq.bz2]]

を得る。同様に、Experiment DRX019820 のFASTQを開いて、
-[[DRR021674_1.fastq.bz2:ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA002/DRA002407/DRX019820/DRR021674_1.fastq.bz2]],
- [[DRR021674_2.fastq.bz2:ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA002/DRA002407/DRX019820/DRR021674_2.fastq.bz2]]を得る。
- [[DRR021674_2.fastq.bz2:ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA002/DRA002407/DRX019820/DRR021674_2.fastq.bz2]]

ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA002/DRA002407/DRX019819
を得る。



**トライアル2 [#t07e4a88]
ここではJSTバイオサイエンスデータベースセンターの[[H28年度 NGSハンズオン講習会カリキュラム(門田先生方):https://biosciencedbc.jp/human/human-resources/workshop/h28-2]]での
[[第2回目「第1部統計解析」の「ゲノム解析・塩基配列解析」:https://biosciencedbc.jp/gadget/human/20160720_1_kadota.pdf]]の
スライド27〜31にある手順で試してみる。
ただし、DDBJパイプラインサービスを使わず、自前でダウンロードして行う。

DDBJのDRA Searchから
[[DDR024501:http://trace.ddbj.nig.ac.jp/DRASearch/run?acc=DRR024501]]
を探してダウンロード。
 wget ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA002/DRA002643/DRX022186/DRR024501_1.fastq.bz2
 bunzip2 DRR024501_1.fastq.bz2
 wget ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA002/DRA002643/DRX022186/DRR024501_2.fastq.bz2
 bunzip2 DRR024501_2.fastq.bz2

Step 1) Assembly
 platanus assemble -t 15 -m 120 -o out -f DRR024501_1.fastq DRR024501_2.fastq

  &ref(DRR024501_Assemblylog.txt,,Assemblyのログ);

Step 2) Scaffold
 platanus scaffold -o out -c out_contig.fa -b out_contigBubble.fa -IP1 ./DRR024501_1.fastq ./DRR024501_2.fastq -t 8

  &ref(DRR024501_Scaffoldlog.txt,,Scaffoldのログ);

Step 3) Gap_Close
 platanus gap_close -o out -c out_scaffold.fa -IP1 ./DRR024501_1.fastq ./DRR024501_2.fastq -t 8

  &ref(DRR024501_GapCloselog.txt,,Gap_Closeのログ);

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS